Modern web teknolojileri kullanarak Türkçe metin işleme ve normalizasyon işlemlerini GPU üzerinde hızlandıran gelişmiş bir araç.
- GPU Hızlandırmalı İşleme: WebGPU API kullanarak paralel metin işleme
- Türkçe Karakter Desteği: Ç, Ğ, I, İ, Ö, Ş, Ü karakterlerinin doğru tanınması
- Gerçek Zamanlı Analiz: Karakter türlerine göre detaylı istatistikler
- Yüksek Performans: CPU'ya göre çok daha hızlı işleme hızları
- Metin Ön İşleme: NLP projeleri için Türkçe metin normalizasyonu
- Karakter Analizi: Türkçe karakterlerin tespiti ve sayımı
- Performans Testleri: GPU vs CPU karşılaştırmaları
- WebGPU Geliştirme: Modern web grafik programlama örnekleri
- Modern bir web tarayıcısı (Chrome 113+, Firefox 113+, Safari 16.4+)
- WebGPU desteği etkin olmalı
- Yerel web sunucusu (CORS politikaları nedeniyle)
- Projeyi klonlayın
git clone https://github.com/toprakdeviren/turkish-text-processor.git
cd turkish-text-processor- Yerel sunucu başlatın
# Python ile
python -m http.server 8000
# Node.js ile
npx serve .- Tarayıcıda açın
http://localhost:8000
- Karakter Türü Analizi: ASCII, Türkçe, UTF-8 karakterlerin tespiti
- Performans Metrikleri: İşleme süresi ve throughput hesaplaması
- Paralel İşleme: WebGPU compute shader'ları ile eşzamanlı işlem
Türkçe Harfler: ç, ğ, ı, ö, ş, ü, Ç, Ğ, İ, Ö, Ş, Ü
ASCII Karakterler: a-z, A-Z, 0-9, özel karakterler
UTF-8 Karakterler: emoji, özel semboller
Proje, özel geliştirilmiş WGSL compute shader'ı kullanarak:
- UTF-8 byte dizilerini paralel işler
- Türkçe karakterleri doğru şekilde tanır
- Kelime sınırlarını tespit eder
- İstatistiksel verileri hesaplar
- Workgroup Paralelleştirme: 256 thread'lik workgroup'lar
- Verimli Buffer Yönetimi: Minimal bellek kullanımı
- Asenkron İşleme: UI bloklamadan GPU işlemleri
- GitHub: @toprakdeviren
- Email: [email protected]
- Proje Linki: https://github.com/toprakdeviren/turkish-text-processor