Bilimsel Araştırma Projeleri Destek Programı kapsamında "Yapay Zeka ve Doğal Dil İşleme Teknolojilerini Kullanarak Dokümanların ve Metinlerin Gizlilik Derecelerinin Sınıflandırılması" başlıklı projemiz kabul edilmiştir.
Proje Özeti
|
Bu çalışmada belgelerin gizlilik derecelerinin içerik temelli ve açıklanabilir yapay zeka yöntemleriyle otomatik olarak sınıflandırılması amaçlanmaktadır. Çalışmada biri hazır (Wikileaks), diğeri ise yeni oluşturulacak (FRUS) olmak üzere iki metin veri seti kullanılacaktır. Bu veri setlerine çeşitli ön işleme adımları uygulanacak, ardından TF-IDF, Word2Vec, Sentence-BERT ve konu modelleme gibi tekniklerle özellik çıkarımı yapılacaktır. Sınıflandırma sürecinde; klasik makine öğrenmesi algoritmaları, derin öğrenme yapıları, transformer tabanlı modeller ve açık kaynak büyük dil modelleri (LLaMA, Falcon vb.) bağımsız olarak denenerek performansları karşılaştırılacaktır. Veri dengesizliği durumunda SMOTE ve GAN gibi veri artırma yöntemleri uygulanacaktır. Model başarıları sadece doğruluk oranıyla değil, F1-skoru, ROC-AUC, PR-AUC ve açıklanabilirlik yöntemleri (SHAP, LIME, Attention görselleştirmeleri) ile kapsamlı biçimde değerlendirilecektir. Bu çalışmada gizli belge tespiti alanına özgün bir FRUS veri seti sunma, farklı modelleme tekniklerini karşılaştırmalı biçimde analiz etme ve açıklanabilirliği ön planda tutan güvenilir bir sınıflandırma sistemi geliştirmek hedeflenmektedir. |
Dünyanın En Etkili Bilim İnsanları Listesinde 2 Öğretim Üyemiz Yer Aldı
TÜSEB Proje Başvurumuz Kabul Edildi
Erasmus+ Kurumlararası Anlaşmalar
9. Uluslararası Bilgisayar Bilimleri ve Mühendisliği Konferansı 26-28 Ekim 2024 (UBMK)
12. Uluslararası Dijital Adli Tıp ve Güvenlik Sempozyumu (ISDFS) 29-30 Nisan 2024
Görüş, istek ve değerlendirmelerinizi bize iletin.