Search This Blog

Wednesday, August 24, 2016

தமிழைக் கணினியில் மொழிபெயர்க்கும் மென்பொருளை உருவாக்கப் பயன்படும் ஆய்வு உமாதேவி - முதல்முறையாக முனைவர் பட்டம்

தமிழைக் கணினியில் மொழிபெயர்க்கும் மென்பொருளை உருவாக்கப் பயன்படும் ஆய்வு
உமாதேவி - முதல்முறையாக முனைவர் பட்டம் பெற்ற சென்னை மாணவி
சென்னை
தமிழைக் கணினியில் மொழி பெயர்க்கும் மென்பொருளை உரு வாக்கப் பயன்படும் ஆய்வுக் கட்டுரைக்கு முதன்முறையாக முனைவர் பட்டம் பெற்றிருக்கிறார் சென்னை மாணவி.
மொழிபெயர்ப்புக்கு 100 ஆண்டு வரலாறு உண்டு. இந்தியாவில் இந்தி உட்பட பல மொழிகளின் மொழிபெயர்ப்புக்குக் கணினியை ஏறக்குறைய முழுமையாகப் பயன்படுத்திவிட்டனர் என்றே சொல் லலாம். அதாவது பிற மொழியில் நடைமுறையில் எழுதப் படும் ஒரு வாக்கியத்தைக் கணினியில் பதிவு செய்தால், அது அப்ப டியே ஆங்கிலத்தில் மொழி பெயர்க் கப்படுகிறது. ஆனால், தமிழ் மொழி யில், நாம் எழுதுகிற தமிழை அப்படியே ஆங்கிலத்தில் மொழி பெயர்க்கும் நிலை இப்போது இல்லை.
இந்நிலையில், சென்னைப் பல் கலைக்கழக மொழியியல் துறை முன்னாள் தலைவர் ந. தெய்வ சுந்தரம், நாம் எழுதுகிற தமி ழைக் கணினி தானாகவே மொழி பெயர்க்கும் திறன்கொண்ட மென் பொருளை உருவாக்கும் முயற்சி யில் ஈடுபட்டுள்ளார்.
இத்தகைய முயற்சியில் தன்னை முழுமையாக ஈடுபடுத்திக் கொண்டுள்ள இவரது மாணவி கி.உமாதேவி, நாம் எழுதுகிற தமிழை அப்படியே பொருள் மாறா மல் ஆங்கிலத்தில் மொழிபெயர்ப் பது குறித்து இலக்கண அடிப்படை யில் மூன்று ஆண்டுகளாக ஆய்வு செய்துள்ளார். இதற்காக சென் னைப் பல்கலைக்கழகத்தில் முனை வர் பட்டம் பெற்றிருக்கிறார். அவருக்கு ஆங்கிலத்துறைப் பேராசிரியர் அருணாதேவி என்பவர் வழிகாட்டியாக இருந்துள்ளார்.
இளங்கலை தமிழ் படித்த உமாதேவி, மொழியியலை அறிவி யல்பூர்வமாகப் படித்து அதில் முதுகலை பட்டம் பெற்றார். தமிழ் வாக்கியத்தை அப்படியே இலக் கணப் பிழையில்லாமல் ஆங்கிலத் தில் மொழிபெயர்க்கப் பயன்படும் ஆய்வுக் கட்டுரை எழுத வேண் டும். அதைக் கணினியிலும் சாத்திய மாக்க வேண்டும் என்பதை வாழ் நாள் லட்சியமாகக் கொண்டுள்ளார்.
தனது ஆய்வு நூல் பற்றி அவர் நம்மிடம் பகிர்ந்து கொண்ட தகவல்கள்:
ஆங்கில மொழி, ஐரோப்பிய மொழிக் குடும்பம், தமிழ் மொழி, திராவிட மொழிக் குடும்பம். அத னால், இரண்டு மொழிகளின் இலக் கணத்தில் ஒற்றுமை, வேற்றுமை நிறையவே இருக்கிறது. தமிழில் இலக்கணச் சொற்கள் ஏராள மாக இணைக்கப்படுகிறது. ஆங்கி லத்தில் அவ்வாறு இல்லை.
‘Write’ என்ற வார்த்தைக்கு write, writes, wrote, written, writing, to write ஆகிய 6 வடிவங்கள்தான் இருக்கின்றன. ஆனால், ‘எழுது’ என்ற தமிழ் வேர்ச் சொல்லுக்கு எழுத வேண்டும், எழுதியிருக்கலாம், எழுதியாக வேண்டும் என்பன போன்ற சுமார் 8 ஆயிரம் வடிவங்கள் இருக்கின்றன. எனது ஆய்வுக் கட்டுரையில் 400-க்கும் மேற்பட்ட தமிழ் இலக்கணச் சொற்களுக்கு ஆங்கில மொழிபெயர்ப்பைக் கொடுத்துள்ளேன்.
அதாவது, தமிழ் ஆங்கிலம் அகராதியில் இலக்கணச் சொற்கள் சேராத தமிழ் அடிச்சொல்லுக்கு மட்டுமே இணையான ஆங்கிலச் சொல் - மொழிபெயர்ப்பு இருக்கும். உதாரணத்துக்கு ‘சொல்’ என்ற வார்த்தையை அகராதியில் பார்த் தால் ‘tell’ என்ற மொழிபெயர்ப்பு இருக்கும்.
ஆனால், நாம் சாதாரணமா கப் பயன்படுத்துகிற இலக்கணச் சொற்கள் சேர்ந்த தமிழ்ச்சொல் லுக்கு மொழிபெயர்ப்பு அகராதியில் இருக்காது. எடுத்துக்காட்டாக ‘சொல்லப்பட்டிருக்கலாம்’, ‘சொல் லியாக வேண்டும்’ என்பது போன்ற பல்வேறு வார்த்தைகளுக்கு ஆங் கில அகராதியில் மொழிபெயர்ப்பு இருக்காது. இதைச் சரியாக மொழி பெயர்க்க வேண்டும் என்றால், முதலில் தமிழ்ச் சொல்லை இலக் கணப்படி முறையாகப் பிரிக்க வேண்டும்.
பின்னர் அதற்கு இணை யாக ஆங்கில இலக்கணச் சொல் லைக் கண்டுபிடிக்க வேண்டும். அவ்வாறு செய்தால்தான், தமிழ் சொல்லுக்கு இணையான ஆங்கில மொழிபெயர்ப்பு மிகச்சரியாக இருக்கும்.
ஒரு சொல்லை மொழிபெயர்ப் பதற்கும், ஒரு வாக்கியத்தை மொழி பெயர்ப்பதற்கும் இடைப்பட்ட நிலையே எனது ஆய்வு நூல். வாக்கிய மொழிபெயர்ப்புக்கான ஆய்வு மேற்கொள்ள இந்த நூல் மிகவும் பயன்படும். எனவே, மொழி பெயர்ப்புக்கான இரண்டாவது அகராதி என்று இதைச் சொல்லலாம். அத்துடன் கணினியில் தமிழை ‘டைப்’ செய்தால் அதற்கு இணையான ஆங்கில மொழி பெயர்ப்பு வழங்கும் திறன்கொண்ட மென்பொருளை உருவாக்கவும் இந்த ஆய்வு நூலே அடிப்படையாக இருக்கும்.
இவ்வாறு உமாதேவி கூறினார்.
https://etamil.thehindu.com/index.php?rt=index/index