Dilbilim bazlı Knowledge Graph ve chatbot.

  • Bizim 4 senelik notları not tutan herkesten alıp çok detaylı bir çetele gibi tuttuğumuz, tüm o öğrendiğimiz bilgilerin gelişimini sunan, bir program

  • Her ders için bir terimler sözlüğü gibi bir şey,

    • Dilbilim için terimler sözlüğü var, onun OCR’lanıp düzenlenip bizim ekole uygulanabilir hale getirdiğimiz bir sözlük
      • Daha sonrasında her ders için, örnek veriyorum Ruhdilbilim için;
        • Sınıf sınıf bunların zorluk düzeylerini ayarladığımız, eldeki infoları (tagler üzerinden zorluk düzeylerini filtrelediğimiz ve daha temiz bir graph knowledge ayırdığımız bir program
        • Sözdizim için ağaçların çizimi, hocaların kullandığımız ekolleri ayırdığımız şekiller
  • Chatbot muhabbetini çok detaylı bir şey olmasını istediğim için söylemiyorum, pragmatik bir şeyler sunabileceğimiz bir şeyler olmasını istiyorum ve

    • Bizim ekolümüzü hacettepenin karşısında öne çıkarabilecekleri bir şey olur
  • Bu en basidinden 1. sınıfa gelen birisi mesela doğuştancılık ekolünden olduğumuzu, davranışsal ekolü reddettiğimizi öğreniyor ya

    • Mesela sezgiselcilik ne demekten tut, alttaki açıklama gibi hocaların eksik kaldığı yerleri toparlama
    • Yer yer sınav öncesi bakabilecekleri bir glossary gibi bir şey
    • İlgisi olmayanın yani bölümü okumayanın başvurabileceği bir şey, okuyanın da daha detaylı incelemek için bakabileceği bir ilişki ağı
      • 1 tane bir şey bakacak bile olsalar, kısa anlaşılabilir, algılayabilecekleri yazılar
  • Bizim için her zaman araştırılabilir ve geliştirilebilir bir şeyler demek;

    • Tek bir kişiye bağımlı olmadığımız, herkesten not alabileceğimiz bir şeyler olur
  • Harcayacağımız zaman dolayısıyla bunu uzun süre maintain edip subscription bile yapabiliriz hosting parasını çıkarmak ve genel olarak yan gelir olarak ama asıl amacım bölümdeki çok temel bir açığı kapatıp bölümün bible’ı olarak başvurulabilecek küçük bilgi parçacıkları sunmak

  • NLP bazlı bir proje olacağı için köküne kadar dilbilimle alakalı bir şeyleri hem öğreniyor hem de daha önemlisi uyguluyor olacağız.

  • Bölüm dergisi yerine mesela böyle bir şeyler hazırlayıp buraya yazılar sunmaya başlamak da beni çok çeken bir fikir, herkes dergi yazar ama kimsenin böylesine detaylı bir şeyler sunan bir veritabanı yok, uzun bir süre daha olmayacak.

    • Deneylerin haberini buradan geçebiliriz
    • DilbilimOP için buradan calendar event booklayabiliriz ve özetini burada yayınlayabiliriz ya da transkriptini
  • Bilinking olacak —Obsidian ya da Wikipedia tarzinda—

  • Az çok öğrenmemiz gerekecek durumlar;

    • Vektör db ve embeddingler
    • NLP
    • Knowledge Graphs ve onların bileşenleri
      • 4. sınıftaki sözlükçe dersiyle de bağlantılı anladığım kadarıyla
    • Chatbot mantığı ve safeguardlar (özellikle bölüm adına bir şeyler olacağı için uncensored mümkün değil)
    • OCR la falan bol bol uğraşacağız gibime geliyor
    • Eğer yapabilirsek Reinforcement learningden yararlanacağız
    • Site için UI ve hostingle alakalı belirli detaylar
    • Prompt engineering e de gireceğiz

Dependency Visualizer Ya da Distillasyonla Uğraşabileceğimiz Bir Şeyler

  • Spacy nin dependency visualizer ını alıp Türkçe için geliştirebiliriz çünkü İngilizcesi ve Fransızcası dahil olmak üzere çok zayıf kalıyor,
    • NLP de tagging muhabbetlerinin iyi çalışması gerekiyor, biraz daha iki projedeki amacım da neredeyse Xiaomi redmi note 12 pro da kullanabilecek kadar küçük ama aynı zamanda güçlü bir şeyler çıkartabilmek istiyorum ki hem aşırı data ihtiyacımız olmadan çok güçlü bir şeyler çıkartalım ve her yere applicable hale getirelim
    • Hem hosting maliyeti olarak çok tutmayacak hem de efficency olarak maksimize ettiğimiz bir şeyler her yerde çok ciddi manada iş yapar
  • Arxiv databaseinden bir şeyler çekebilir miyiz diye düşünüyorum, bizim erişilebilir ve free dataya ihtiyacımız var.