Yapay Zeka ve Doğal Dil İşleme Teknolojilerini Kullanarak Dokümanların ve Metinlerin Gizlilik Derecelerinin Sınıflandırılması
3 Şubat 2026 | 15:06

Bilimsel Araştırma Projeleri Destek Programı kapsamında "Yapay Zeka ve Doğal Dil İşleme Teknolojilerini Kullanarak Dokümanların ve Metinlerin Gizlilik Derecelerinin Sınıflandırılması" başlıklı projemiz kabul edilmiştir. 


Proje Özeti

Bu çalışmada belgelerin gizlilik derecelerinin içerik temelli ve açıklanabilir yapay zeka yöntemleriyle otomatik olarak sınıflandırılması amaçlanmaktadır. Çalışmada biri hazır (Wikileaks), diğeri ise yeni oluşturulacak (FRUS) olmak üzere iki metin veri seti kullanılacaktır. Bu veri setlerine çeşitli ön işleme adımları uygulanacak, ardından TF-IDF, Word2Vec, Sentence-BERT ve konu modelleme gibi tekniklerle özellik çıkarımı yapılacaktır. Sınıflandırma sürecinde; klasik makine öğrenmesi algoritmaları, derin öğrenme yapıları, transformer tabanlı modeller ve açık kaynak büyük dil modelleri (LLaMA, Falcon vb.) bağımsız olarak denenerek performansları karşılaştırılacaktır. Veri dengesizliği durumunda SMOTE ve GAN gibi veri artırma yöntemleri uygulanacaktır. Model başarıları sadece doğruluk oranıyla değil, F1-skoru, ROC-AUC, PR-AUC ve açıklanabilirlik yöntemleri (SHAP, LIME, Attention görselleştirmeleri) ile kapsamlı biçimde değerlendirilecektir. Bu çalışmada gizli belge tespiti alanına özgün bir FRUS veri seti sunma, farklı modelleme tekniklerini karşılaştırmalı biçimde analiz etme ve açıklanabilirliği ön planda tutan güvenilir bir sınıflandırma sistemi geliştirmek hedeflenmektedir.

background image