Hakkında

Sözlü Türkçe Derlemi projesinin (STC) amacı, yüz yüze ya da çeşitli iletişim araçlarıyla (örn., telefonda ve kitle iletişim araçları) gerçekleşen Türkçe konuşmalardan oluşacak 1 milyon sözcüklük bir veritabanını dilbilimsel yöntemlerle çözümleyerek günümüz Türkçesinin bilgisayar ortamında izlenmesini ve taranmasını sağlayacak bilimsel bir kaynak oluşturmaktır.

Sözlü Türkçe Derlemi adıyla anılan bu kaynak, diğer bir deyişle, sözlü derlem (İng. spoken corpus), dil ve dille ilgili alanlarda araştırma ve çalışmalar yapan bilim insanlarının kullanımına sunulacaktır.

STC’de konuşmalar EXMARaLDA programları yardımıyla yazıya dökülmektedir. Söz konusu yazılar ses/görüntü kayıtları ile birlikte eşzamanlı olarak izlenebilmektedir.

STC, Ekim 2008-Nisan 2010 tarihleri arasında TÜBİTAK tarafından 108K283 no.lu proje ile desteklenmiştir. STC halen ODTÜ, Yabancı Diller Eğitimi Bölümünce desteklenmekte  ve sunulmakta olup, BAP-05-03-2011-001 çerçevisinde derlem incelemeleri sürdürülmektedir. İlk küçük çaplı deneme ürünü 2010 yılında araştırmacıların araştırmaları için  sunulmuştur. 2013 sonuna doğru ise konuşmaların yazıya çevrilmiş hali ile yaklaşık 400,000 sözcüklük kısmının beta sürümü olarak kullanıma sunulması planlanmıştır. Bundan sonraki yıllarda ise, derlemin boyutunun büyütülmesi öngörülmektedir.

Sözlü Türkçe Derlemi’nin kullanımında, aşağıdaki kurallara uyulacaktır.

(1) Üçüncü Kişilere Dağıtım
Sözlü Türkçe Derlemi’ni kullananlar hiçbir koşulda, Sözlü Türkçe Derlemi’ni üçüncü kişilerle paylaşamaz.

(2) Kimlik Bilgilerinin Korunması
Sözlü Türkçe Derlemi’ni kullanan kişiler, herhangi bir konuşanın kimliğini açığa çıkaran her türlü bilgiyi gizli tutacaklardır. Ses ve görüntü kayıtları ile ilgili yapılacak her türlü sözlü ve yazılı yayında veya bilgilendirmede konuşanların kimlik bilgileri (örneğin, ad ve soyad, ikamet adresi, okul adı, işyeri adı) kesinlikle gizli tutulacaktır. Herhangi bir yayında ya da bilgilendirmede, Sözlü Türkçe Derlemi’inde kodlanan bilginin dışında, konuşanın kimliğini açığa çıkarabilecek bilgi verilemez.

(3) Konuşanların Sözlerinin Değerlendirilmesi
Sözlü Türkçe Derlemi’ndeki sözceler ya da konuşanlar üzerine izlenim, yerme, kişiliği zedeleyici söz vb. eleştiri içeren değerlendirmeler kamuoyu ile paylaşılamaz.

Projeyle ilgili herhangi bir sorunuz olursa ya da herhangi bir şekilde katkıda bulunmak isterseniz (örn., ses/görüntü kaydı yapmak, var olan ses/görüntü kayıtlarınızı derleme bağışlamak  ya da dilbilimsel çözümleme yapmak) iletişim sayfamızdaki formu doldurarak ya da aşağıdaki adrese yazarak bizimle iletişime geçebilirsiniz.

Derlemin oluşmasında katkıda bulunan kişi ve kurumların adları sitemizde yayınlanlanmaktadır.  Kayıt yapan veya bağışlayan ya da çevriyazı yapan kişi ve kurumlara emekleri karşılığı sertifika verilmektedir.
odtustd@metu.edu.tr