ساخت خطایاب فارسی در آزمایشگاه پردازش متن دانشگاه تهران

اخبار فناوری / سرپرست آزمایشگاه پردازش هوشمند متن و زبان طبیعی دانشکده مهندسی برق و کامپیوتر دانشگاه تهران از ساخت خطایاب فارسی به‌عنوان دستاورد آزمایشگاه پردازش متن و زبان‌های طبیعی در دانشگاه تهران خبر داد.

هشام فیلی در گفت‌وگو با ایسنا، با بیان این‌که امروزه حجم زیادی از محتوی فارسی رسمی در قالب اخبار، مقالات، پایان‌نامه‌ها و نامه‌های اداری تولید و به‌صورت الکترونیکی منتشر می‌شود، اظهار کرد: از این منظر صحیح و استاندارد بودن این متون اهمیت زیادی پیدا می‌کند.

وی افزود: در این راستا پژوهشگران آزمایشگاه پردازش متن و زبان‌های طبیعی دانشگاه تهران موفق شدند یک محصول کارا و دقیق جهت صیانت از خط و زبان فارسی در فضای مجازی تولید کنند.

مدیرگروه نرم افزار دانشکده مهندسی برق و کامپیوتر خاطرنشان کرد: این نرم‌افزار که خطایاب املایی – معنایی ویراست‌من نام دارد، به‌صورت یک افزونه روی ویرایشگرهای پرکاربردی چون Microsoft Word و همچنین CKEditor (در محیط وب) نصب می‌شود و قابلیت استانداردسازی، خطایابی و انجام اصلاحات هوشمند را به کاربران این ویرایشگرها ارائه می‌کند.

دکتر فیلی خاطرنشان کرد: بنابراین تولیدکنندگان محتوا می‌توانند با استفاده از این ابزار محتوای الکترونیکی خود را ویراستاری کرده و اخبار، مقالات و پایان‌نامه‌هایی به‌صورت استاندارد و بدون خطای نگارشی و املایی تولید کنند.

وی تصریح کرد: یکی از قابلیت‌های مهم «ویراست‌من» اصلاحات خودکار است که می‌تواند بسیاری از خطاها اعم از خطاهای املایی، سجاوندی، فاصله‌گذاری بین کلمات و برخی از خطاهای معنایی را به‌صورت کاملاً خودکار اصلاح کند.

استاد تمام گروه هوش ماشین و رباتیک دانشکده مهندسی برق و کامپیوتر دانشگاه تهران، گفت: از دیگر نقاط قوت این دستاورد نسبت به محصولات مشابه تطبیق‌پذیری با نیاز کاربر است، به‌عبارت دیگر «ویراست‌من» مانند یک انسان سعی می‌کند پیشنهادات خود را با نوشته‌ها و اصلاحات کاربران تطبیق دهد و از این‌رو کیفیت برتری نسبت به ابزارهای مشابه دارد.

دکتر فیلی اصلاح رسم‌الخط بر اساس آئین نگارش فارسی و استانداردسازی نگارشی، استاندارد کردن و فارسی‌سازی اعداد و خطایابی املایی با دقت بسیار بالا را از قابلیت‌های مهم «ویراست‌من» برشمرد و افزود: از دیگر قابلیت‌های این نرم‌افزار می‌توان به پیشنهاد کلمات درست برای خطاهای تشخیص داده شده، تشخیص و رفع خطاهای رایج و پرتکرار، ارائه پیشنهادهای فرهنگستان زبان و ادب فارسی و تشخیص خطاهای معنایی اشاره کرد.

وی یادآور شد: تصحیح خودکار(بدون دخالت کاربر) در موارد با اطمینان بالا، امکان افزودن کلمات جدید به لغت‌نامه خطایاب، امکان اعمال یک اصلاح توسط کاربر به‌طور یکجا بر تمام خطاهای مشابه در یک متن و یادگیری خودکار از متن‌هایی که تا به حال ویرایش شده، برای متن‌های جدید از دیگر قابلیت‌های خطایاب فارسی «ویراست‌من» است.

سرپرست آزمایشگاه پردازش هوشمند متن و زبان طبیعی دانشکده مهندسی برق و کامپیوتر دانشگاه تهران افزود: علاقه‌مندان این سامانه می‌توانند از طریق سایت virastman.ir افزونه «ویراست‌من» را برای استفاده شخصی رایگان دانلود و نصب کنند. همچنین تولیدکنندگان سامانه‌های سازمانی مانند پورتال و اتوماسیون اداری نیز می‌توانند جهت به‌کارگیری نسخه سرور «ویراست‌من» یا API آن از طریق «تماس با ما» سایت فوق اقدام کنند.

براساس این گزارش، آزمایشگاه پردازش هوشمند متن و زبان طبیعی تحت‌سرپرستی دکتر هشام فیلی، استاد تمام دانشکده مهندسی برق و کامپیوتر دانشگاه تهران، بیش از یک دهه است که در زمینه توسعه ابزارهای مربوط به خط و زبان فارسی در محیط رایانه‌ای فعالیت می‌کند. از جمله فعالیت‌های پیشین این آزمایشگاه می‌توان به توسعه مترجم هوشمند متون انگلیسی – فارسی که با نام مترجم هوشمند فرازین معرفی شده بود، اشاره کرد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *