Dilbilimci Olarak Yazılımı Lehimize Kullanmak


Dilbilim, dışarıdan bakıldığında bilgisayar biliminden uzak görünse de aslında iki bilim dalının arakesiti oldukça kapsamlıdır (bkz. hesaplamalı dilbilim). Ancak bu yazımda, bu arakesitten ziyade, dilbilimin mikro ve makro alanlarında çalışan araştırmacıların yazılımı nasıl çalışmalarına entegre edebileceğinden bahsetmek istiyorum.


Dilbilimci Olarak Neden Yazılımla Uğraşmalıyım?

Bu soru karşısında akla birden fazla cevap gelebilir. Bence, bunlardan bence başlıca ikisi: otomasyon ve gelecek çalışmalar için bir çerçeve oluşturmaktır.

Otomasyon, özellikle büyük verilerle çalışırken bize büyük kolaylık sağlayacak bir yöntemdir. Herhangi bir çalışmanın veri toplama ve inceleme aşamaları, el yordamıyla yapılmak yerine yazılım yardımıyla yapıldığında araştırmacının işini hem zaman tasarrufuyla hem de daha kolay veri manipülasyonuyla kolaylaştıracaktır. Bu amaçla üretilen Excel gibi uygulamalar olsa da kendi programlarımızı yazmak, bize daha esnek ve hedefe yönelik bir çalışma ortamı yaratacaktır. Bazen gerçekten iki saatinizi ayırıp yazdığınız bir kod sizi saatlerce uğraşmaktan kurtarabiliyor. 🙂

Gelecek çalışmalar için bir çerçeve oluşturmanın en güzel örneği, özellikle dilbilim alanında kullanılması için geliştirilmiş uygulamalardır. Başlıca akla gelen uygulamalar Praat1, Lambda Calculator2 ve Python için yazılmış NLTK3 kütüphanesi bu konuya iyi örneklerdir.

Praat

Praat, özellikle sesbilimciler tarafından yaygın olarak kullanılan ücretsiz ve açık kaynaklı bir yazılımdır. Ses analizi, sentezi ve manipülasyonu gibi çeşitli fonksiyonlara sahiptir. Özellikle fonetik çalışmalarında, konuşma seslerinin spektrum analizini yaparak formant frekanslarını, temel frekansları ve yoğunlukları belirlemekte kullanılır. Ayrıca, ses dosyalarını etiketleme, zaman ölçümleri yapma ve farklı ses dosyalarını karşılaştırma gibi olanaklar sunar. Praat’ın kullanıcı dostu arayüzü ve geniş özellik yelpazesi, onu dilbilim araştırmalarında vazgeçilmez bir araç haline getirmiştir.

Praat, özellikle yazılımın kendi dilini kullanarak üretilebilen “script”ler kullanılarak dilbilimcilerin uygulamayı istedikleri şekilde kullanabilmesini sağlaması bakımından eşsiz bir yapımdır.

Lambda Calculator

Lambda Calculator, dilbilimciler için mantıksal formülleri ve ifadeleri hesaplamak ve çözmek için geliştirilmiş bir araçtır. Özellikle anlambilim ve mantıksal dilbilim çalışmalarında kullanılır. Bu uygulama, lambda hesabı gibi matematiksel dil teorilerini ve mantık yapılarının analizini kolaylaştırır. Kullanıcılar, karmaşık ifadeleri girerek bunların mantıksal sonuçlarını görebilir ve dilsel yapılar arasındaki ilişkileri daha iyi anlayabilir. Lambda Calculator, dilbilimcilerin mantıksal dil analizlerini daha sistematik ve verimli bir şekilde yapmalarını sağlamıştır.

NLTK (Natural Language Toolkit)

NLTK, Python programlama dili için geliştirilmiş güçlü bir kütüphanedir ve doğal dil işleme (NLP) çalışmalarında yaygın olarak kullanılır. Dilbilimciler, NLTK sayesinde metinleri analiz edebilir, dil modelleri oluşturabilir ve çeşitli dil işleme görevlerini otomatikleştirebilir. NLTK, sözcük ayırma, kök bulma, sözcük türü etiketleme, anlam ayrıştırma ve makine öğrenimi gibi birçok işlevi destekler. Ayrıca, çeşitli dil veritabanları ve kaynakları ile entegre çalışarak araştırmacılara geniş bir çalışma alanı sunar. NLTK’nın modüler yapısı ve esnekliği, dilbilimcilerin kendi ihtiyaçlarına yönelik özel analizler yapmalarına olanak tanır.

Bu uygulamalar her ne kadar dilbilim içerisindeki farkı alanlara hitap etse de ortak noktaları, yazılımların yayımlandıklarından beri dilbilimde vazgeçilmez araçlar haline gelmiş olmalarıdır. Kısa bir alanyazın taramasıyla bu uygulamaların ne derece değerli olduğunu görmek hiç de zor değildir.

Alanyazındaki Eksiklik

Ne yazık ki ülkemizde hem dilbilim hem yazılım alanlarına ilgisi olan araştırmacı sayısı, batı ülkelerine kıyasla oldukça az. Her ne kadar bu zengin alana adım atmak isteyen araştırmacı sayısı elle tutulur olsa da çoğu özellikle nereden başlayacağını bilmediğinden başka alanlara yöneliyor. Bu açığın kapanması açısından öğretimden ziyade yönlendirmeye yönelik eğitimler düzenlenmesi ülkemizde dilbilimin geleceği açısından yararlı olacaktır.

Nereden Başlamalı?

Yazımın bu kısmında, bir başlangıç olarak bana sıkça yöneltilen birkaç soruyu cevaplamak istiyorum. Bu bakımdan, programlama dillerini öğrenmek ve yazılım araçlarını kullanmak isteyen dilbilimcilere yönelik birkaç öneri sunmak istedim.

Hangi programlama dilini öğrenmeliyim?

Bu aslında çalışılmak istenen alana bağlı. Örneğin, büyük veri setleriyle çalışacağınız bir çalışma için R gibi istatistik odaklı bir dili tercih etmeniz sizin için iyi bir tercih olacaktır. Hakeza, metin çalışan bir araştırmacının metin konusundaki kütüphaneleri kullanabilmek için Python öğrenmesi mantıklı bir tercih olabilir. Her durumda; C++, C# ya da Python gibi çok amaçlı dilleri öğrenmek hem programcılığın temellerini öğrenmek hem de devamında daha özel alanlarda uzmanlaşmak için doğru tercihler olacaktır.

Öğrenirken nasıl bir yol haritası takip etmeliyim?

Bir programlama dili öğrenmek, herhangi bir doğal dili öğrenmekten çok da farklı sayılmaz – herkesin daha iyi öğrendiği bir yöntem vardır. İşitsel öğrenmeye yatkın biri internet üzerinden öğretici videolardan daha fazla verim alırken görsel bir öğrenici kitaplardan daha rahat ezber yapabilir. Her halükarda giriş seviyesi kaynaklardan yararlanarak devam edebilirsiniz.

Yapay zekâ ile dil modeli yapmak istiyorum, ne yapmalıyım?

Yapay zekâ uygulamaları, günümüzde pek çok programlama dili tarafından desteklenmekte fakat özellikle kullanıcı dostu olduğunu düşündüğüm TensorFlow4 ve Scikit-learn5 kütüphanelerini Python ile kullanarak başlayabilirsiniz. Dil modelleri, doğası gereği büyük verilerle çalışır. Bu sebeple veri konusunda kendinizi geliştirmeniz işinize yarayacaktır.

Sonuç

Sonuç olarak, dilbilim ve bilgisayar bilimi, çalışmalarda düşündüğümüzden çok daha geniş ve kapsamlıdır. Bu iki disiplinin birleşimi, dilbilim araştırmalarında büyük yenilikler ve kolaylıklar sağlamaktadır. Yazılım ve programlama dillerinin, özellikle dilbilim alanında, mikro ve makro ölçekte araştırmacılara sunduğu avantajlar, hem otomasyon hem de gelecek çalışmalar için sağlam bir çerçeve oluşturması açısından büyük önem taşımaktadır.

Dilbilimciler olarak, yazılımı lehimize kullanarak, araştırmalarımızda daha verimli ve kapsamlı sonuçlar elde edebiliriz. Teknolojinin sunduğu bu imkanları en iyi şekilde değerlendirerek, dilbilim alanında önemli katkılar sağlayabiliriz.

Kaynakça

1Boersma, P., & Weenink, D. (2021). Praat: doing phonetics by computer [Computer program]. Version 6.1.38, retrieved 2 January 2021 from http://www.praat.org/

2Champollion, L., Tauberer, J., & Romero, M. (2007). The Penn Lambda Calculator.

3Bird, Steven, Edward Loper and Ewan Klein (2009), Natural Language Processing with Python. O’Reilly Media Inc.

4TensorFlow Developers. (2024). TensorFlow (v2.16.2). Zenodo. https://doi.org/10.5281/zenodo.12586505

5Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … & Duchesnay, É. (2011). Scikit-learn: Machine learning in Python. the Journal of machine Learning research12, 2825-2830.

01.07.24


Leave a Reply

Your email address will not be published. Required fields are marked *