برای پیکره فرهنگنویسی تحت فشار قرار گرفتیم
پس از پشت سر گذاشتن حاشیههایی، حالا که سامانه پیکره فرهنگنویسی به صورت آزمایشی راهاندازی شده، نسرین پرویزی به اینکه این پیکره بهعنوان پیکره زبان فارسی نوشته نشده، بلکه پیکره فرهنگ جامع زبان فارسی است، اشاره میکند و از فشاری که منجر به عمومیسازی این پیکره شد میگوید.
به گزارش ایسنا، همه چیز از پویشی که آذرماه سال گذشته با هدف عمومی شدن دسترسی به پیکره زبانی فرهنگستان به راه افتاد شروع شد؛ متنی که با امضای 500 نفر منتشر شد. این پویش با اعلام نارضایی از امکان دسترسی محدود به پیکره - که تا آن روز تنها در اختیار اعضای گروه فرهنگنویسی و نهایتا برخی اعضای دیگر فرهنگستان بوده است - جز آنکه به اهمیت کلی و اساسی پیکرههای رایانهای در پژوهشهای زبانی اشاره میکرد، وضعیت همهگیری کرونا را نیز دلیل مضاعفی برای عمومیساختن دسترسی به پیکرههای رایانهای فرهنگستان میدانست. این پویش مدعی آن بود که بدون حاشیه و بی آنکه سراغ رسانهها و جنجالسازی برود (و شاید به همین دلیل) موفق شده بسیاری از افراد شناختهشده مطالعات زبان و ادبیات فارسی، از جمله برخی اعضای پیوسته و وابسته خود فرهنگستان (ژاله آموزگار، مصطفی جیحونی، محمدجعفر یاحقی، حسین معصومی همدانی، محمود بیجنخان، رسول جعفریان و اکبر نحوی) را با خود همراه کند.
در پی این موضوع، غلامعلی حدادعادل، رئیس فرهنگستان زبان و ادب فارسی، طی نامهای خطاب به علیاشرف صادقی، مدیر گروه فرهنگنویسی، امکان دسترسی عمومی به این پیکره را از او جویا شد.
در پی دریافت پاسخ علیاشرف صادقی به نامه رئیس فرهنگستان زبان و ادب فارسی، حداد عادل اعلام کرد «با توجه به مشکلات و اشکالاتی که در نامه آقای دکتر صادقی بدانها اشاره شده است، فرهنگستان در نظر دارد برای رفع آنها برنامهریزی و اقدام کند و امید میرود تا چند ماه آینده، با تنظیم آئیننامه لازم و تأمین زیرساختهای فنی، امکان بهرهمندی پژوهشگران از پیکره فرهنگنویسی فراهم گردد.»
چیزی نگذشت که در دیماه سال گذشته، فرهنگستان زبان و ادب فارسی ضمن ارائه گزارشی درخصوص شکلگیری پویش «دسترسی عمومی به پیکره زبانی فرهنگستان» از تاکید رئیس فرهنگستان بر رفع موانع دسترسی عمومی به پیکره فرهنگنویسی خبر داد.
پس از این، ماجرا تا حدود ششماه بعد تقریبا مسکوت ماند تا اینکه در تیرماه سال جاری فرهنگستان زبان و ادب فارسی وعده داد سامانهای راهاندازی خواهد شد که در آن امکان بهرهمندی پژوهشگران از پیکره فرهنگنویسی فرهنگستان، بهصورت برخط، فراهم بشود.
و در نهایت چند روز پیش بود که از راهاندازی آزمایشی سامانه پیکره فرهنگنویسی خبر رسید.
حالا نسرین پرویزی، معاون گروه واژهگزینی فرهنگستان زبان و ادب فارسی در گفتوگو با ایسنا از روند شکلگیری این پیکره، هزینههایی که برای آن صرف شده است و نیز از حاشیههایی که منجر به فشار برای عمومی کردن آن شد، میگوید.
او در آغاز دراینباره توضیح میدهد: پیکره فرهنگنویسی در واقع اصلا فقط برای کار فرهنگ جامع زبان فارسی در فرهنگستان تهیه شده است؛ یعنی به این شکل که قصدمان باشد یک پیکره برای زبان فارسی دربیاوریم، نبوده. برای همین هم ساختار آن با پیکرههای دیگری که به عنوان پیکره ساخته میشوند و قصد از آنها استفاده برای منظور خاصی نیست، تفاوت دارد. کار این پیکره سالها طول کشید و هنوز هم ادامه دارد؛ هنوز هم کتابهای جدیدی به آن اضافه میکنیم.
به گفته پرویزی، در حال حاضر حدود 1490 کتاب در این پیکره موجود است و حدود یکمیلیون مدخل از این متون استخراج شده است.
او در عین حال بیان میکند: هر چند اگر تکراریها را هم در نظر بگیریم، بیش از چهارمیلیون شاهد وجود دارد که این واژهها در آنها به کار رفتهاند؛ بنابراین این پیکره شامل بیش از چهارمیلیون جمله است که در نهایت بیش از 35 جلد خواهد بود.
نسرین پرویزی میافزاید: این پیکره در طی سالها آماده شده؛ منتها به این شکل است، برای مثال ممکن است جملهای را آورده باشیم اما به دلیل طولانی بودن، چند نقطه گذاشته باشیم و کامل نباشد، و به این ترتیب، متن در اختیار عموم نیست. از قبل هم گفته بودیم متن کلماتی که در پیکره استفاده شده، موجود نیست، فقط جملهها وجود دارند که میتوان واژهها را از آنها استخراج کرد. این برای کار فرهنگنویسی ما کاملا مفید بوده و از آن استفاده کردیم. چون متون در اختیار ما بوده است. اما سعی میکنیم این 1490 کتاب را به نوعی به این پیکره پیوست کنیم. اما این کار هنوز انجام نشده است. شاید بیش از 200، 300 کتاب هنوز به این صورت آماده نشدهاند. اگر بتوانیم باید برای مابقی هم هزینه و به این شکل آماده کنیم. در حال حاضر، این برنامه به صورت آزمایشی در اختیار کارکنان فرهنگستان زبان و ادب فارسی قرار گرفته تا سه ماه بر روی آن کار کنند تا ببینیم با چه مشکلاتی مواجه خواهد شد. در صورتی که این نسخه جواب بدهد و مشکلات اساسی نداشته باشد، تحت شرایطی در اختیار عموم قرار خواهد گرفت.
او همچنین با اشاره به زمان طولانیای که صرف جمعآوری این پیکره شده، میگوید: گروه فرهنگنویسی از ابتدای فعالیت فرهنگستان زبان و ادب فارسی وجود داشته اما فعالیت خود را قدری دیر آغاز کرد. مثلا تا سال 1391، 92 این پیکره دیگر آماده شد، حدود 15 سال وقت صرف شد تا آماده شود؛ منتها کامل نشده بود. مثلا حدود 1200 کتاب بود که به ترتیب طی هشتسال گذشته افزایش پیدا کرد؛ حدود 300، 400 کتاب دیگر اضافه شد.
معاون گروه واژهگزینی فرهنگستان سپس اظهار میکند: تعداد کتابها در بعضی قرنها کم است، بنابراین منابع آن قرنها کامل است. اما درخصوص برخی قرون، هنوز بعضی کتابها خوانده نشدهاند. مقداری از متون معاصر نیز در حال اضافهشدن هستند. البته در مورد متون معاصر، خیلی وقتها از وبگاههای دیگری استفاده میکنیم. چون آنها دارند و شاید نیاز نباشد ما خودمان برای کار فرهنگنویسی وقت صرف کنیم. حالا اگر قرار باشد این پیکره را جداگانه در نظر بگیریم، ممکن است به تدریج این متون را هم بخوانیم و اضافه کنیم. مسلما هزینه خیلی زیادی هم صرف این کار شده است چون کارکنان فرهنگستان در حین کار جاری خود، ضمن خواندن این کتابها مدخلها را انتخاب کردند، حروفنگاری و بازبینی هم انجام شده است. البته ممکن است غلطهایی در آنها باشد، اما به هر حال زمان زیادی صرف شده.
او در پاسخ به این سوال که چرا علیرغم آزمایشی بودن این سامانه و البته مشارکت پژوهشگران فرهنگستان در جمعآوری آن، انتقادهایی (ایسنا در حال پیگیری و بررسی این انتقادها است) نسبت به سامانه ایجادشده وجود دارد نیز میگوید: من هنوز انتقادی نشنیدهام. فقط یک عده گفته بودند که چرا زودتر از موعد منتشر شد. در واقع ماجرا از این قرار بود که وقتی خودمان در حال بررسی این سامانه بودیم، یک عده زودتر دیده بودند - بدون اینکه اعلام شده باشد - در حالی که خودمان در حال امتحان کردن و مذاکره با شرکتی که قرارداد داشتیم، بودیم. با این حال، ممکن است انتقادهایی هم وجود داشته باشد.
پرویزی در توضیح بیشتر میافزاید: متاسفانه ما بسیار تحت فشار قرار گرفتیم، برای اینکه جوی در فضای مجازی شکل گرفت که فرهنگستان پیکرهای آماده کرده اما فقط استادان فرهنگستان از آن بهرهبرداری میکنند و نمیخواهند بیرون بدهند و یک عده دارند سوء استفاده میکنند و مقالاتشان را براساس آنها مینویسند. در حالی که در فرهنگستان یک عده کار میکنند و هر روز با این واژهها سروکار دارند. این پیکره درونسازمانی است و قرار نبوده برای عموم نوشته شود.
او با بیان اینکه فرهنگ جامع زبان فارسی حاوی اطلاعات این پیکره خواهد بود، میگوید: هیچجا همه اسناد و مدارکشان را حین کار منتشر نمیکنند؛ چه پیکره زبان فارسی باشد و چه هر چیز دیگری. اما این پیکره به عنوان پیکره زبان فارسی نوشته نشده، بلکه به عنوان پیکره برای فرهنگ جامع زبان فارسی نوشته شده. برای همین ممکن است در ساختار آن اشکالاتی وجود داشته باشد. اما چون اصرار بود که در اختیار عموم قرار بگیرد، با همان وضع موجود در اختیار عموم قرار گرفت. اگر به ساختار اشکالی گرفته میشود، به این علت است که چیزی را از ما خواستند که برای عموم نوشته نشده بود. بنابراین، طبیعی است، ممکن است مشکلاتی وجود داشته باشد.
نسرین پرویزی در عین حال بیان میکند: چون فرهنگ جامع زبان فارسی هم به صورت برخط عرضه میشود و هم به صورت چاپی، ممکن است نواقصی داشته باشد. اما صورت نرمافزاری دائما بهروز میشود. با این حال چون کتابهای قدیمی تقریبا همه خوانده شدهاند، بعید است به مطلبی درباره واژههای قدیمی بربخوریم. باز هم اگر فردی مطلب تازهای پیدا کرد، به ما معرفی کند تا خوانده و اضافه شود. نسخهای که در اختیار عموم است، از نظر ما دیگر اصلاحاتی ندارد، ولی فقط داریم سعی میکنیم اگر بتوانیم تمام منابعی را که خواندهایم به این پیوست کنیم تا کار کسانی که میخواهند از این پیکره استفاده کنند، راحت شود. البته این کار مقداری زمان و هزینه میطلبد و با وضع بودجه فعلی شاید مشکل باشد. تا حالا از حدود 1500 نسخه توانستهایم حدود 300 نسخه را برای پیوست آماده کنیم.
او در پایان از افرادی که به این سامانه مراجعه میکنند خواست تا اگر اشکالاتی را در آن میبینند، به فرهنگستان زبان و ادب فارسی اعلام کنند.
انتهای پیام