سه‌شنبه 6 آذر 1403

برای پیکره فرهنگ‌نویسی تحت فشار قرار گرفتیم

خبرگزاری ایسنا مشاهده در مرجع
برای پیکره فرهنگ‌نویسی تحت فشار قرار گرفتیم

پس از پشت سر گذاشتن حاشیه‌هایی، حالا که سامانه پیکره فرهنگ‌نویسی به صورت آزمایشی راه‌اندازی شده، نسرین پرویزی به این‌که این پیکره به‌عنوان پیکره زبان فارسی نوشته نشده، بلکه پیکره فرهنگ جامع زبان فارسی است، اشاره می‌کند و از فشاری که منجر به عمومی‌سازی این پیکره شد می‌گوید.

به گزارش ایسنا، همه چیز از پویشی که آذرماه سال گذشته با هدف عمومی شدن دسترسی به پیکره زبانی فرهنگستان به راه افتاد شروع شد؛ متنی که با امضای 500 نفر منتشر شد. این پویش با اعلام نارضایی از امکان دسترسی محدود به پیکره - که تا آن روز تنها در اختیار اعضای گروه فرهنگ‌نویسی و نهایتا برخی اعضای دیگر فرهنگستان بوده است - جز آن‌که به اهمیت کلی و اساسی پیکره‌های رایانه‌ای در پژوهش‌های زبانی اشاره می‌کرد، وضعیت همه‌گیری کرونا را نیز دلیل مضاعفی برای عمومی‌ساختن دسترسی به پیکره‌های رایانه‌ای فرهنگستان می‌دانست. این پویش مدعی آن بود که بدون حاشیه و بی آن‌که سراغ رسانه‌ها و جنجال‌سازی برود (و شاید به همین دلیل) موفق شده بسیاری از افراد شناخته‌شده مطالعات زبان و ادبیات فارسی، از جمله برخی اعضای پیوسته و وابسته خود فرهنگستان (ژاله آموزگار، مصطفی جیحونی، محمدجعفر یاحقی، حسین معصومی همدانی، محمود بی‌جن‌خان، رسول جعفریان و اکبر نحوی) را با خود همراه کند.

در پی این موضوع، غلامعلی حدادعادل، رئیس فرهنگستان زبان و ادب فارسی، طی نامه‌ای خطاب به علی‌اشرف صادقی، مدیر گروه فرهنگ‌نویسی، امکان دسترسی عمومی به این پیکره را از او جویا شد.

در پی دریافت پاسخ علی‌اشرف صادقی به نامه رئیس فرهنگستان زبان و ادب فارسی، حداد عادل اعلام کرد «با توجه به مشکلات و اشکالاتی که در نامه آقای دکتر صادقی بدان‌ها اشاره شده است، فرهنگستان در نظر دارد برای رفع آن‌ها برنامه‌ریزی و اقدام کند و امید می‌رود تا چند ماه آینده، با تنظیم آئین‌نامه لازم و تأمین زیرساخت‌های فنی، امکان بهره‌مندی پژوهشگران از پیکره فرهنگ‌نویسی فراهم گردد.»

چیزی نگذشت که در دی‌ماه سال گذشته، فرهنگستان زبان و ادب فارسی ضمن ارائه گزارشی درخصوص شکل‌گیری پویش «دسترسی عمومی به پیکره زبانی فرهنگستان» از تاکید رئیس فرهنگستان بر رفع موانع دسترسی عمومی به پیکره فرهنگ‌نویسی خبر داد.

پس از این، ماجرا تا حدود شش‌ماه بعد تقریبا مسکوت ماند تا این‌که در تیرماه سال جاری فرهنگستان زبان و ادب فارسی وعده داد سامانه‌ای راه‌اندازی خواهد شد که در آن امکان بهره‌مندی پژوهشگران از پیکره فرهنگ‌نویسی فرهنگستان، به‌صورت برخط، فراهم بشود.

و در نهایت چند روز پیش بود که از راه‌اندازی آزمایشی سامانه پیکره فرهنگ‌نویسی خبر رسید.

حالا نسرین پرویزی، معاون گروه واژه‌گزینی فرهنگستان زبان و ادب فارسی در گفت‌وگو با ایسنا از روند شکل‌گیری این پیکره، هزینه‌هایی که برای آن صرف شده است و نیز از حاشیه‌هایی که منجر به فشار برای عمومی کردن آن شد، می‌گوید.

او در آغاز دراین‌باره توضیح می‌دهد: پیکره فرهنگ‌نویسی در واقع اصلا فقط برای کار فرهنگ جامع زبان فارسی در فرهنگستان تهیه شده است؛ یعنی به این شکل که قصدمان باشد یک پیکره برای زبان فارسی دربیاوریم، نبوده. برای همین هم ساختار آن با پیکره‌های دیگری که به عنوان پیکره ساخته می‌شوند و قصد از آن‌ها استفاده برای منظور خاصی نیست، تفاوت دارد. کار این پیکره سال‌ها طول کشید و هنوز هم ادامه دارد؛ هنوز هم کتاب‌های جدیدی به آن اضافه می‌کنیم.

به گفته پرویزی، در حال حاضر حدود 1490 کتاب در این پیکره موجود است و حدود یک‌میلیون مدخل از این متون استخراج شده است.

او در عین حال بیان می‌کند: هر چند اگر تکراری‌ها را هم در نظر بگیریم، بیش از چهارمیلیون شاهد وجود دارد که این واژه‌ها در آن‌ها به کار رفته‌اند؛ بنابراین این پیکره شامل بیش از چهارمیلیون جمله است که در نهایت بیش از 35 جلد خواهد بود.

نسرین پرویزی می‌افزاید: این پیکره در طی سال‌ها آماده شده؛ منتها به این شکل است، برای مثال ممکن است جمله‌ای را آورده باشیم اما به دلیل طولانی بودن، چند نقطه گذاشته باشیم و کامل نباشد، و به این ترتیب، متن در اختیار عموم نیست. از قبل هم گفته بودیم متن کلماتی که در پیکره استفاده شده، موجود نیست، فقط جمله‌ها وجود دارند که می‌توان واژه‌ها را از آن‌ها استخراج کرد. این برای کار فرهنگ‌نویسی ما کاملا مفید بوده و از آن استفاده کردیم. چون متون در اختیار ما بوده است. اما سعی می‌کنیم این 1490 کتاب را به نوعی به این پیکره پیوست کنیم. اما این کار هنوز انجام نشده است. شاید بیش از 200، 300 کتاب هنوز به این صورت آماده نشده‌اند. اگر بتوانیم باید برای مابقی هم هزینه و به این شکل آماده کنیم. در حال حاضر، این برنامه به صورت آزمایشی در اختیار کارکنان فرهنگستان زبان و ادب فارسی قرار گرفته تا سه ماه بر روی آن کار کنند تا ببینیم با چه مشکلاتی مواجه خواهد شد. در صورتی که این نسخه جواب بدهد و مشکلات اساسی نداشته باشد، تحت شرایطی در اختیار عموم قرار خواهد گرفت.

او همچنین با اشاره به زمان طولانی‌ای که صرف جمع‌آوری این پیکره شده، می‌گوید: گروه فرهنگ‌نویسی از ابتدای فعالیت فرهنگستان زبان و ادب فارسی وجود داشته اما فعالیت خود را قدری دیر آغاز کرد. مثلا تا سال 1391، 92 این پیکره دیگر آماده شد، حدود 15 سال وقت صرف شد تا آماده شود؛ منتها کامل نشده بود. مثلا حدود 1200 کتاب بود که به ترتیب طی هشت‌سال گذشته افزایش پیدا کرد؛ حدود 300، 400 کتاب دیگر اضافه شد.

معاون گروه واژه‌گزینی فرهنگستان سپس اظهار می‌کند: تعداد کتاب‌ها در بعضی قرن‌ها کم است، بنابراین منابع آن قرن‌ها کامل است. اما درخصوص برخی قرون، هنوز بعضی کتاب‌ها خوانده نشده‌اند. مقداری از متون معاصر نیز در حال اضافه‌شدن هستند. البته در مورد متون معاصر، خیلی وقت‌ها از وبگاه‌های دیگری استفاده می‌کنیم. چون آن‌ها دارند و شاید نیاز نباشد ما خودمان برای کار فرهنگ‌نویسی وقت صرف کنیم. حالا اگر قرار باشد این پیکره را جداگانه در نظر بگیریم، ممکن است به تدریج این متون را هم بخوانیم و اضافه کنیم. مسلما هزینه خیلی زیادی هم صرف این کار شده است چون کارکنان فرهنگستان در حین کار جاری خود، ضمن خواندن این کتاب‌ها مدخل‌ها را انتخاب کردند، حروف‌نگاری و بازبینی هم انجام شده است. البته ممکن است غلط‌هایی در آن‌ها باشد، اما به هر حال زمان زیادی صرف شده.

او در پاسخ به این سوال که چرا علی‌رغم آزمایشی بودن این سامانه و البته مشارکت پژوهشگران فرهنگستان در جمع‌آوری آن، انتقادهایی (ایسنا در حال پیگیری و بررسی این انتقادها است) نسبت به سامانه ایجادشده وجود دارد نیز می‌گوید: من هنوز انتقادی نشنیده‌ام. فقط یک عده گفته بودند که چرا زودتر از موعد منتشر شد. در واقع ماجرا از این قرار بود که وقتی خودمان در حال بررسی این سامانه بودیم، یک عده زودتر دیده بودند - بدون این‌که اعلام شده باشد - در حالی که خودمان در حال امتحان کردن و مذاکره با شرکتی که قرارداد داشتیم، بودیم. با این حال، ممکن است انتقادهایی هم وجود داشته باشد.

پرویزی در توضیح بیشتر می‌افزاید: متاسفانه ما بسیار تحت فشار قرار گرفتیم، برای این‌که جوی در فضای مجازی شکل گرفت که فرهنگستان پیکره‌ای آماده کرده اما فقط استادان فرهنگستان از آن بهره‌برداری می‌کنند و نمی‌خواهند بیرون بدهند و یک عده دارند سوء استفاده می‌کنند و مقالات‌شان را براساس آن‌ها می‌نویسند. در حالی که در فرهنگستان یک عده کار می‌کنند و هر روز با این واژه‌ها سروکار دارند. این پیکره درون‌سازمانی است و قرار نبوده برای عموم نوشته شود.

او با بیان این‌که فرهنگ جامع زبان فارسی حاوی اطلاعات این پیکره خواهد بود، می‌گوید: هیچ‌جا همه اسناد و مدارک‌شان را حین کار منتشر نمی‌کنند؛ چه پیکره زبان فارسی باشد و چه هر چیز دیگری. اما این پیکره به عنوان پیکره زبان فارسی نوشته نشده، بلکه به عنوان پیکره برای فرهنگ جامع زبان فارسی نوشته شده. برای همین ممکن است در ساختار آن اشکالاتی وجود داشته باشد. اما چون اصرار بود که در اختیار عموم قرار بگیرد، با همان وضع موجود در اختیار عموم قرار گرفت. اگر به ساختار اشکالی گرفته می‌شود، به این علت است که چیزی را از ما خواستند که برای عموم نوشته نشده بود. بنابراین، طبیعی است، ممکن است مشکلاتی وجود داشته باشد.

نسرین پرویزی در عین حال بیان می‌کند: چون فرهنگ جامع زبان فارسی هم به صورت برخط عرضه می‌شود و هم به صورت چاپی، ممکن است نواقصی داشته باشد. اما صورت نرم‌افزاری دائما به‌روز می‌شود. با این حال چون کتاب‌های قدیمی تقریبا همه خوانده شده‌اند، بعید است به مطلبی درباره واژه‌های قدیمی بربخوریم. باز هم اگر فردی مطلب تازه‌ای پیدا کرد، به ما معرفی کند تا خوانده و اضافه شود. نسخه‌ای که در اختیار عموم است، از نظر ما دیگر اصلاحاتی ندارد، ولی فقط داریم سعی می‌کنیم اگر بتوانیم تمام منابعی را که خوانده‌ایم به این پیوست کنیم تا کار کسانی که می‌خواهند از این پیکره استفاده کنند، راحت شود. البته این کار مقداری زمان و هزینه می‌طلبد و با وضع بودجه فعلی شاید مشکل باشد. تا حالا از حدود 1500 نسخه توانسته‌ایم حدود 300 نسخه را برای پیوست آماده کنیم.

او در پایان از افرادی که به این سامانه مراجعه می‌کنند خواست تا اگر اشکالاتی را در آن می‌بینند، به فرهنگستان زبان و ادب فارسی اعلام کنند.

انتهای پیام

برای پیکره فرهنگ‌نویسی تحت فشار قرار گرفتیم 2