📁 کامپیوتر و IT (آموزش_و_پژوهش)کد:31929امتیاز:4.8📅 بروزرسانی: هفته پیش

مدلی کارا برای ساخت پیکره متنی موازی از روی پیکره متنی تطبیقی

دانلود فایل اصلی

برای دریافت فایل کامل روی دکمه زیر کلیک کنید

دانلود و مشاهده جزئیات
ℹ️
برای مشاهده محصول و توضیحات به ادامه مطلب بروید

توضیحات

مدلی کارا برای ساخت پیکره متنی موازی از روی پیکره متنی تطبیقیعنوان:مدلی کارا برای ساخت پیکره متنی موازی از روی پیکره متنی تطبیقی تعداد صفحات : 98 چکیده: اغلب رویکردهای نوین ترجمه در حوزه ترجمه ماشینی از جمله ترجمه ماشینی آماری، ترجمه ماشینی مبتنی بر مثال و ترجمه ماشینی ترکیبی از مجموعه متون هم‌ترجمه تحت عنوان پیکره‌های متنی موازی به عنوان داده آموزشی اصلی استفاده می‌کنند. اما برای اغلب زبان‌ها پیکره‌های موازی به میزان بسیار کمی در دسترس هستند و یا مربوط به دامنه خاصی از نوشتجات می‌شوند. در طرف دیگر پیکره‌های تطبیقی قرار دارند که مواد اولیه آنها به راحتی به دست می‌آید. پیکره‌های تطبیقی شامل متون هم‌ترجمه نیستند اما در آن هر دو متن در دو زبان مختلف از نظر شباهت معیارهایی چون محتوا، تاریخ انتشار، عنوان و … با یکدیگر قابل تطبیق هستند. پیکره‌های تطبیقی شامل جملاتی هستند که می‌توانند ترجمه خوبی برای یکدیگر باشند. هدف این رساله ساخت خودکار پیکره موازی با استخراج اینگونه جملات از پیکره تطبیقی است. مدلی که در این پژوهش ارائه می‌شود از سه مرحله اصلی تشکیل می‌شود: انتخاب جفت جملات کاندیدای موازی بودن با استفاده از فیلتر نسبت طول جملات و فیلتر تعداد کلمات مشترک انتخاب جفت جملات موازی با استفاده از طبقه‌بند آنتروپی بیشینه و در نظر گرفتن ویژگی‌های مربوط به طول دو جمله، کلمات مشترک آنها و ویژگی‌های مبتنی بر همترازی در سطح کلمه بین دو جمله بالابردن دقت جفت جملات استخراج شده با انتخاب تنها یکی از جملات جفت شده با هر جمله. این کار را می‌توان بوسیله محاسبه نزدیکی آن جمله با ترجمه جملات جفت شده از طرف مقابل توسط معیار TER و انتخاب نزدیک‌ترین جمله انجام داد. در انتها کارآیی مدل ارائه شده در دو بخش ارزیابی طبقه‌بند آنتروپی بیشینه طراحی شده و ارزیابی میزان سودمندی جفت جملات موازی استخراج شده در بهبود کیفیت ترجمه ماشینی بررسی می‌شود. فصل اول: مقدمه 1-1- مقدمه به دلیل افزایش ارتباطات متقابل منطقه‌ای و نیاز برای تبادل اطلاعات، تقاضا برای ترجمه زبان بسیار افزایش یافته است. بسیاری از نوشتجات نیاز به ترجمه دارند از جمله مستندات علمی و فنی، دستورالعمل‌های راهنما، مستندات حقوقی، کتاب‌های درسی، بروشورهای تبلیغاتی، اخبار روزنامه‌ها و غیره؛ که ترجمه برخی از آنها سخت و چالش برانگیز است اما اکثرا خسته کننده و تکراری هستند و در عین حال به انسجام و دقت نیاز دارند. برآوردن نیازهای روز افزون ترجمه برای مترجمان حرفه‌ای دشوار است. در چنین موقعیتی ترجمه ماشینی می‌تواند به عنوان یک جایگزین به کار گرفته شود. ترجمه ماشینی بعد از 65 سال یکی از قدیمی‌ترین کاربردهای کامپیوتر است. در طول سال‌ها، ترجمه ماشینی مرکز توجه تحقیقات زبان‌شناسان، روان‌شناسان، فیلسوفان، دانشمندان و مهندسان علم کامپیوتر بوده است. اغراق نیست اگر بگوییم کارهای جدید در حوزه ترجمه ماشینی، به طور قابل ملاحظه‌ای در توسعه زمینه‌هایی نظیر زبان شناسی رایانه‌ای، هوش مصنوعی و پردازش زبان‌های طبیعی برنامه‌گرا، مشارکت کرده است. ترجمه ماشینی را می‌توان به این صورت تعریف کرد: “ترجمه از یک زبان طبیعی (زبان مبدأ) به زبان دیگر (زبان مقصد) با استفاده از سیستم‌های کامپیوتری شده و به همراه یا بدون کمک انسان”. کار پژوهشی در حوزه ترجمه ماشینی به هدف بزرگ ترجمه تمام خودکار با کیفیت بالا (قابل نشر) محدود نمی‌شود. غالبا ترجمه‌های ناهموار برای بازبینی موضوعات خارجی کافی است. تلاش‌های اخیر، در جهت ساخت کاربردهای محدودی در ترکیب با تشخیص گفتار به خصوص برای دستگاه‌های دستی می‌باشند. ترجمه ماشینی می‌تواند به عنوان پایه‌ای برای ویرایش‌های بعدی به کار گرفته شود، مترجم‌ها معمولا با ابزارهایی نظیر حافظه‌های ترجمه که از فناوری ترجمه ماشینی استفاده می‌کنند اما آنها را در کنترل خود قرار می‌دهند، استفاده می‌کنند. ترجمه ماشینی یکی از حوزه‌های پژوهشی «زبانشناسی رایانه‌ای» است. تا کنون روش‌های مختلفی جهت خودکار کردن ترجمه ابداع شده است، که در نوشتجات حوزه ترجمه ماشینی به صورت‌های مختلفی دسته‌بندی شده‌اند. شکل 1-1 انواع روش‌های ترجمه ماشینی موجود را در قالب دسته‌بندی که در آمده است نشان می‌دهد. 1-1-1- ترجمه ماشینی مبتنی بر فرهنگ لغت این نوع ترجمه ماشینی مبتنی بر مدخل‌های فرهنگ لغت است؛ و در آن از معادل کلمه جهت تولید ترجمه استفاده می‌شود. اولین نسل ترجمه ماشینی (از اواخر دهه 1940 تا اواسط دهه 1960) کاملا بر مبنای فرهنگ لغت‌های الکترونیک بودند. این روش همچنان تا حدی در ترجمه عبارات و نه جملات مفید است. اکثر روش‌هایی که بعدا توسعه داده شدند کم یا بیش از فرهنگ لغات دوزبانه بهره می‌گیرند . 2-1-1- ترجمه ماشینی مبتنی بر قانون ترجمه ماشینی مبتنی بر قانون با اطلاعات ریخت شناسی، نحوی و معنایی زبان‌های مبدأ و مقصد سر و کار دارد. قوانین زبانی از این اطلاعات ساخته می‌شوند. این روش می‌تواند با پدیده‌های مختلف زبانی مقابله کند و قابل گسترش و قابل نگهداشت است، اما استثنائات موجود در دستور زبان مشکلاتی به این سیستم می‌افزاید. همچنین فرآیند پژوهشی آن نیاز به سرمایه‌گذاری زیادی دارد. هدف ترجمه ماشینی مبتنی بر قانون تبدیل ساختارهای زبان مبدأ به ساختارهای زبان مقصد است. این روش رویکردهای مختلفی دارد. – رویکرد مستقیم: کلمات زبان مبدأ بدون عبور از یک نمایش میانی ترجمه می‌شوند. در این روش به بستر متن، معنی و دامنه توجه نمی‌شود. – رویکرد انتقالی: مدل انتقالی متعلق به نسل دوم ترجمه ماشینی است (از اواسط دهه 1960 تا دهه 1980). در این مدل، زبان مبدأ به یک انتزاع که نمایشی کمتر مختص به زبان است، انتقال می‌یابد. سپس یک نمایش معادل برای زبان مقصد (با همان سطح انتزاع) با استفاده از فرهنگ لغات دوزبانه و قوانین گرامری تولید می‌شود. – میان زبانی: این روش متعلق به نسل سوم ترجمه ماشینی است. در این روش زبان مبدأ به یک زبان (نمایش) میانی تغییر شکل می‌دهد که این زبان میانی مستقل از هر دو زبان شرکت کننده (مبدأ و مقصد) در ترجمه است. سپس ترجمه برای زبان مقصد از این نمایش کمکی به دست می‌آید. از اینرو در این نوع سیستم تنها به دو ماژول تجزیه و ترکیب نیاز است. همچینن به دلیل مستقل بودن این روش از زبان‌های مبدأ و مقصد، بیشتر در ماشین‌های ترجمه چندزبانه استفاده می‌شود. این روش بر یک نمایش واحد از زبان‌های مختلف تأکید می‌کند. 3-1-1- ترجمه ماشینی مبتنی بر دانش این روش با واژه‌نامه‌ای مفهومی‌که یک دامنه را نشان می‌دهد سر و کار دارد. این روش شامل دو مرحله تحلیل و تولید است. اجزای پایه‌ای یک ماشین ترجمه مبتنی بر دانش عبارتند از یک آنتولوژی از مفاهیم، واژه‌نامه و گرامر زبان مبدأ برای فرآیند تحلیل، واژه‌نامه و گرامر برای زبان مقصد و قوانین نگاشت بین نحو زبان میانی و زبان‌های مبدأ و مقصد. 4-1-1- ترجمه ماشینی مبتنی بر پیکره رویکرد ترجمه ماشینی مبتنی بر پیکره‌های متنی از سال 1989 ظهور پیدا کرد و به طور وسیعی در حوزه ترجمه ماشینی به آن پرداخته شد؛ و به دلیل دقت بالای این روش در ترجمه، بر دیگر روش‌ها غلبه یافت. در این روش، دانش یا مدل ترجمه به طور خودکار از پیکره‌های متنی (مجموعه متون) دوزبانه گرفته می‌شود. از آنجایی که این رویکرد با حجم زیادی از داده‌ها کار می‌کند، ترجمه ماشینی مبتنی بر پیکره نامیده شده است. برخی از انواع روش‌های مبتنی بر پیکره در ادامه شرح داده می‌شوند. ترجمه ماشینی آماری با اینکه ایده اولیه ترجمه ماشینی آماری توسط وارن ویور در سال 1941 معرفی شد، اما از سال 1993 که این روش توسط محققان آی بی ام مدل شد به طور گسترده‌ای مورد استفاده قرار گرفت؛ به طوری‌که در حال حاضر ترجمه ماشینی آماری رایج‌ترین رویکرد در ترجمه ماشینی به شمار می‌آید. در روش ترجمه ماشینی آماری از مدل‌های آماری استفاده می‌شود که پارامترهای این مدل‌ها از متون دوزبانه یا همان «پیکره‌های موازی» استخراج می‌شوند. به عبارت دیگر سیستم ترجمه ماشینی آماری، احتمالات ترجمه را از پیکره موازی می‌آموزد و با استفاده از این احتمالات برای جملات ورودی که در فرآیند آموزش دیده نشده‌اند، ترجمه‌ای مناسب تولید می‌کند. در این روش از دو مدل عمده به نام مدل‌های مبتنی بر کلمه و مدل‌های مبتنی بر عبارت استفاده می‌شود. ترجمه ماشینی مبتنی بر مثال روشهای ترجمه ماشینی مبتنی بر مثال، روشهای مبتنی بر حافظه نیز نامیده شده‌اند. ایده این روش از سال 1980 در ژاپن شروع شد. این نوع سیستم‌ها تلاش می‌کنند تا جمله‌ای مشابه جمله ورودی در پیکره موازی پیدا کنند، و سپس با اِعمال تغییراتی بر روی جمله ترجمه شده که قبلا ذخیره شده، ترجمه جمله ورودی را تولید کنند. ایده اولیه در این روش، استفاده از ترجمه‌های انسانی موجود برای ترجمه متن‌های جدید است. لذا کافی است متون جدید به قطعه‌های کوچک شکسته شود و ترجمه معادل این قطعات، در پایگاه داده‌ای از قطعات ترجمه شده جستجو شده و ترجمه مورد نظر تولید گردد. این روش دارای محدودیت دادگان می‌باشد. جمع‌آوری مجموعه مثال‌های بسیار بزرگ نیز کل زبان را پوشش نمی دهد. بنابراین معمولا این روش برای زیر مجموعه‌های محدودی از یک زبان استفاده می‌شود.

دسته‌بندی‌های سایت

📂 ... pdf (رمان،شعر،داستان)16402 فایل📂 معارف اسلامی (آموزش_و_پژوهش)4771 فایل📂 ... PowerPoint پاورپوینت4628 فایل📂 معماری (آموزش_و_پژوهش)3827 فایل📂 روانشناسی و مشاوره (آموزش_و_پژوهش)3098 فایل📂 ... پروژه های تحصیلی و آموزشی2600 فایل📂 مدیریت (آموزش_و_پژوهش)2469 فایل📂 🔺... پژوهش ها و محتوای مجازی2458 فایل📂 حقوق (آموزش_و_پژوهش)1961 فایل📂 حسابداری (آموزش_و_پژوهش)1834 فایل📂 امتحانات نهایی1689 فایل📂 تاریخ (آموزش_و_پژوهش)1278 فایل📂 اقتصاد (آموزش_و_پژوهش)1169 فایل📂 برق و مخابرات (آموزش_و_پژوهش)1163 فایل📂 کامپیوتر و IT (آموزش_و_پژوهش)1095 فایل📂 ادبیات (آموزش_و_پژوهش)1021 فایل📂 علوم تربیتی (آموزش_و_پژوهش)986 فایل📂 پزشکی (آموزش_و_پژوهش)902 فایل📂 مکانیک (آموزش_و_پژوهش)884 فایل📂 ... psdو (نمونه قرارداد،طرح،الگو)883 فایل📂 گوناگون873 فایل📂 جغرافیا (آموزش_و_پژوهش)795 فایل📂 هنر و گرافیک (آموزش_و_پژوهش)577 فایل📂 عمران و نقشه برداری (آموزش_و_پژوهش)537 فایل📂 بهداشت (آموزش_و_پژوهش)494 فایل📂 تربیت بدنی (آموزش_و_پژوهش)488 فایل📂 مواد و متالورژی (آموزش_و_پژوهش)481 فایل📂 کشاورزی و محیط زیست (آموزش_و_پژوهش)458 فایل📂 علوم اجتماعی (آموزش_و_پژوهش)437 فایل📂 علوم سیاسی (آموزش_و_پژوهش)357 فایل📂 شهرسازی (آموزش_و_پژوهش)281 فایل📂 شیمی (آموزش_و_پژوهش)261 فایل📂 کامپیوتر261 فایل📂 صنایع (آموزش_و_پژوهش)247 فایل📂 استخدامی239 فایل📂 ... پروژه های صنعتی و احداث201 فایل📂 هنر و گرافیک (کارآموزی_و_گزارشات)199 فایل📂 فیزیک (آموزش_و_پژوهش)190 فایل📂 پیام نور179 فایل📂 ریاضی (آموزش_و_پژوهش)170 فایل📂 معماری (کارآموزی_و_گزارشات)168 فایل📂 برق و مخابرات (کارآموزی_و_گزارشات)160 فایل📂 موبایل و اندروید160 فایل📂 مدیریت (مقالات_و_تحقیقات)157 فایل📂 امار و احتمال (آموزش_و_پژوهش)153 فایل📂 عمران و نقشه برداری (کارآموزی_و_گزارشات)150 فایل📂 زبانهای خارجه (آموزش_و_پژوهش)141 فایل📂 صنایع غذایی (آموزش_و_پژوهش)136 فایل📂 زیست شناسی (آموزش_و_پژوهش)134 فایل📂 ... پروژه های تولیدی و اشتغال133 فایل📂 عمران و نقشه برداری (مقالات_و_تحقیقات)133 فایل📂 مکانیک (کارآموزی_و_گزارشات)130 فایل📂 فلسفه و منطق (آموزش_و_پژوهش)126 فایل📂 کامپیوتر و IT (کارآموزی_و_گزارشات)125 فایل📂 صنایع (کارآموزی_و_گزارشات)123 فایل📂 ... پروژه های غذایی و کشاورزی117 فایل📂 پرستاری (آموزش_و_پژوهش)117 فایل📂 حسابداری (کارآموزی_و_گزارشات)110 فایل📂 روانشناسی و مشاوره (مقالات_و_تحقیقات)96 فایل📂 زمین شناسی (آموزش_و_پژوهش)96 فایل📂 ... پروژه های تحقیق و ترجمه مقاله95 فایل📂 مدیریت (کارآموزی_و_گزارشات)90 فایل📂 کشاورزی و محیط زیست (کارآموزی_و_گزارشات)88 فایل📂 علوم تربیتی (کارآموزی_و_گزارشات)86 فایل📂 کنکور سراسری86 فایل📂 بیمه و بانکداری (آموزش_و_پژوهش)83 فایل📂 عمران و نقشه برداری (نظام_مهندسی)76 فایل📂 نفت (آموزش_و_پژوهش)76 فایل📂 برق و مخابرات (مقالات_و_تحقیقات)75 فایل📂 کامپیوتر و IT (مقالات_و_تحقیقات)75 فایل📂 کنکور ارشد و دکتری74 فایل📂 دیگر73 فایل📂 مهندسی پزشکی (آموزش_و_پژوهش)73 فایل📂 شیمی (کارآموزی_و_گزارشات)72 فایل📂 ... پروژه های پرورش و دامپروری69 فایل📂 علوم دامی (آموزش_و_پژوهش)63 فایل📂 ... پروژه های تاسیس و خدمات56 فایل📂 پزشکی (مقالات_و_تحقیقات)52 فایل📂 حقوق (کارآموزی_و_گزارشات)45 فایل📂 تغذیه (آموزش_و_پژوهش)40 فایل📂 حسابداری (مقالات_و_تحقیقات)40 فایل📂 بانک ها40 فایل📂 🔺قالب و پلاگین40 فایل📂 علوم اجتماعی (مقالات_و_تحقیقات)37 فایل📂 مهندسی معدن (آموزش_و_پژوهش)37 فایل📂 C و C++33 فایل📂 پزشکی و پرستاری (کارآموزی_و_گزارشات)29 فایل📂 دندانپزشکی (آموزش_و_پژوهش)28 فایل📂 سی شارپ28 فایل📂 ... پروژه های پزشکی و دارو27 فایل📂 معماری (نظام_مهندسی)27 فایل📂 مامایی (آموزش_و_پژوهش)26 فایل📂 ویژوال بیسیک26 فایل📂 نظام مهندسی25 فایل📂 نفت (کارآموزی_و_گزارشات)25 فایل📂 نساجی (آموزش_و_پژوهش)24 فایل📂 کشاورزی و محیط زیست (مقالات_و_تحقیقات)23 فایل📂 طراحی وب21 فایل📂 انیمیشین و وکتور (آموزش_و_پژوهش)18 فایل📂 داروسازی (آموزش_و_پژوهش)17 فایل📂 مهندسی شیلات (آموزش_و_پژوهش)16 فایل📂 Android14 فایل📂 مهندسی آب (کتب_و_جزوات)13 فایل📂 ICDL13 فایل📂 کشاورزی و محیط زیست (کتب_و_جزوات)13 فایل📂 Matlab13 فایل📂 مکانیک (نظام_مهندسی)12 فایل📂 مهندسی بهداشت (کتب_و_جزوات)12 فایل📂 کتابداری (آموزش_و_پژوهش)12 فایل📂 مواد و متالوژی و معدن (کارآموزی_و_گزارشات)11 فایل📂 آیین نامه رانندگی11 فایل📂 PHP11 فایل📂 داروسازی (کارآموزی_و_گزارشات)11 فایل📂 ... پروژه های کارآموزی و کارورزی10 فایل📂 مهندسی آب و هواشناسي (کارآموزی_و_گزارشات)10 فایل📂 دستگاه های اجرایی9 فایل📂 برق و مخابرات (نظام_مهندسی)8 فایل📂 ... پروژه های کارآفرینی و توجیهی7 فایل📂 وردپرس7 فایل📂 شرکت گاز6 فایل📂 اسمبلی5 فایل📂 Visual Basic.net5 فایل📂 وزارت نیرو4 فایل📂 شرکت نفت4 فایل📂 HTML4 فایل📂 ASP.net4 فایل📂 دلفی4 فایل📂 علوم نجوم (آموزش_و_پژوهش)3 فایل📂 طراحی (کتب_و_جزوات)3 فایل📂 مصاحبه حضوری3 فایل📂 شهرداری3 فایل📂 پایتون1 فایل📂 🔺زبان برنامه نویسی و اسکریپت1 فایل📂 SQL Server1 فایل📂 جاوا1 فایل📂 اسکریپت1 فایل

جستجو در بین فایل‌ها