Bilgisayarlar 2 Yıl Sonra Türkçe Konuşmaya Başlayacak
Türk Dil Kurumu’nun {TDK} tamamlayarak şubat ayı sonunda TÜBİTAK’a sunduğu çalışma ile bilgisayarlar Türkçe olarak anlaşılacak.
Tüm Çeviri İşletmeleri Derneği’nin Antalya’da gerçekleştirdiği kuruluş kongresine katılan TDK Başkanı Prof. Dr. Şükrü Haluk Akalın‚ Türkçenin bilgisayarlarda kullanılması‚ bilgisayar destekli dil bilimi çalışmalarının yapılması‚ başka dilerden Türkçeye doğru çeviri imkanı veren bir proje üzerinde çalışıldığını söyledi.
TDK’nın TÜBİTAK’a sunduğu‚ İstanbul Teknik‚ 9 Eylül‚ Bilkent ve Sabancı Üniversitelerinin de destek verdiği proje ile bilgisayarların ’dilden anlar hale getirileceğini’ söyleyen Akalın‚ Türkiye’de ilk kez böyle bir çalışma yürütüldüğünü belirtti. Çalışmalarına 2 yıl önce başlanan projenin 2 yıl sonra tamamlanmasını öngördüklerini anlatan Akalın‚ ”Bir derleme oluşturma‚ bu batı dillerinde Korpus {konu külliyatı} diye adlandırılıyor. Korpus‚ bir dilin edebi metinlerinin bilgisayara aktarılması ve bu metinler üzerinde çeşitli dil çalışmaları yapılmasıdır. Sözcükler bu çalışmayla hazırlanıyor. Çeviri yazılımları buna göre hazırlanıyor. Türkiye’de yapılmış dar kapsamlı birkaç derlem çalışması var ama bunun geniş kapsamlı bir çalışma olarak yapılması gerekiyordu. Bu çalışma ile Latin harflerine geçişten itibaren ortaya konulmuş edebi metinlerin büyük bir bölümü ve bunların da yazarlarının yayınladığı en son hali bilgisayar ortamına aktarılacak.” dedi.
Çalışma ile milyonlarca sayfanın bilgisayar ortamına aktarılacağına değinen Akalın‚ ”Böylece Türkçenin dil bilgisi araştırmalarını bilgisayar yöntemleri ile yapabilmek üzere‚ sözlük hazırlamayı bilgisayarla yapmak üzere ve çeviri yazılımlarını da bilgisayar aracılığı ile yapmak üzere önemli bir veri tabanı ortaya konulmuş olacak. Bu yapılan çalışma tamamen bilimsel amaçlı bir çalışma ve bilişimcilerle dil bilimcileri ve Türkologları bir araya getiren bir çalışma.” diye konuştu.
Başka dillerden Türkçeye çeviride sağlıklı sonuçlar alınamamasının nedenleri arasında eş sesli sözcüklerin de yer alması olduğuna dikkat çeken Akalın‚ şöyle devam etti: ”Örneğin ’yüz’ kelimesinin cümle içinde ne anlama geldiğini bu dili konuşan bizler biliyoruz ama bilgisayar bilmiyor. Bilgisayarların bunu anlar hale gelmesi için bu çalışmanın yapılaması ve her kelimenin tek tek etiketlenmesi gerekiyor. Bilgisayarların diğer dillerde olduğu gibi dil bilgisi denetimi yapabilmesi‚ çeviri yapabilmesi gibi çalışmalara temel oluşturacak ve Türkçenin bilgisayar ortamında araştırılmasını sağlayacak önemli bir proje. Çalışma‚ TDK’da oluşturduğumuz Türk Dünyası Bilgisayar Destekli Dil Bilimi Çalışma Grubu ile başladı. 2 yıl önce kurduk bu grubu. Bu grup sadece Türkiye Türkçesi için değil aynı zamanda Türk dünyası içinde Türk lehçelerinin de araştırma kapsamında olduğu‚ değerlendirildiği bir grup. Nihai amaç Türk dünyası lehçelerinin de bu işin içine katılması. Ancak öncelikli hedef‚ Türkiye Türkçesinin bilgisayar ortamına aktarılması.”
Kaynak: Türkcan