MİNİMALİST YAPAY ZEKA

Klişe bir tabirle çağın petrolü ya da altını diye adlandırılan “veriler” günümüzde oldukça kıymetli. Birçok kurum ve şirket muhataplarını daha iyi anlamak, daha iyi kararlar almak ve dijital dönüşümlerini daha etkili gerçekleştirmek adına çeşitli verileri işlemektedir. Özellikle iş süreçlerinde yapay zeka destekli uygulamalardan yararlanan kurumların veri işlemeye ihtiyaç duyduğu açıktır. Zira yapay zekanın verilerle eğitilmeden (makine öğrenmesi) kullanılması ondan alınacak verimi de düşürecektir. Bu doğrultuda, makine öğrenmesi sürecinde eldeki verilerin doğru olması kadar çeşitli olması da önem arz etmektedir. Ancak bunu sağlamak her zaman mümkün olmayabilir. Örneğin COVID-19 pandemi sürecinde yapay zeka teknolojisinden yeterince yararlanılamamasındaki sebeplerden biri de elimizdeki mevcut veri miktarının sınırlı olmasıdır. Ayrıca veri işleme kapasiteleri bakımından şirketler arasında farklılıklar mevcuttur. Bazı şirketler veri tekelini elinde barındıracak kadar çok veri işlemekteyken bazıları oldukça az veriye sahiptir. Öte yandan, yapay zekanın daha iyi eğitilmesi için toplanan büyük veri setleri veri koruma hukuku bakımından da risk oluşturmaktadır. Zira veri koruma hukuku açısından veri işleme faaliyetlerinin “ölçülülük ilkesi”ne ve “veri minizasyonu ilkesi”ne uygun olması gerekmektedir. Yani sadece ihtiyaç duyulan miktarda veri, amaçla orantılı olacak şekilde işlenmelidir. Peki daha az veri ile de yapay zekanın eğitilmesi mümkün müdür?

Image for post
MNIST veri seti içerisinden örnekler (WIKIMEDIA)
MNIST veri seti 0’dan 9’a kadar olmak üzere toplamda el yazısıyla yazılmış 70.000 rakamdan oluşur. Bu setin 60.000 tanesi modeli eğitmek için kullanılırken, 10.000 tanesi ise eğitilen modelin performansını test edebilmek için ayrılmıştır.

Waterloo Üniversitesi’nin yürüttüğü bir araştırma sonucu yapay zekanın daha az veriyle de çalışmasının mümkün olabileceğini ortaya konulmuştur. Araştırmacılar 70.000den oluşan MNIST veri setini 10 görüntüye sığdıracak şekilde sadeleştirmişlerdir. Elde edilen 10 görüntü, MNIST veri setlerinin birebir aynısı olmasa da MNIST veri setleriyle eşdeğer miktarda bilgiye yer verilmiştir. “Less than one”-shot veya LO-shot diye adlandırılan bu yeni yöntemde yapay zekanın büyük veri setleriyle eğitilmesi gerekmeden aynı sonucun daha küçük hatta 1 veri kümesiyle eğitilerek de alınabileceği belirtilmiştir. Bu yöntemle birlikte model eğitimi hızlandırma, enerji tüketimini azaltma ve gerekli depolama alanını azaltma açısından da fayda sağlanabilmektedir.

Yukarıda bahsedilen yöntemin veri koruma hukuku açısından da getireceği birtakım avantajlar olacaktır. Veri işleyen kişilerin (veri sorumluları) veri işleme faaliyetlerinde dikkat etmesi gereken birtakım hususlar vardır. Bunlardan bazıları şu şekildedir:

-Kişisel verilerin işlendikleri amaçla bağlantılı, sınırlı ve ölçülü olması,

-İlgili mevzuatta öngörülen veya işlendikleri amaç için gerekli olan süre kadar muhafaza edilmesi,

-Kişisel verilerin hukuka aykırı olarak işlenmesini önlemek, kişisel verilere hukuka aykırı olarak erişilmesini önlemek, kişisel verilerin muhafazasını sağlamak amacıyla uygun güvenlik düzeyini temin etmeye yönelik gerekli her türlü teknik ve idari tedbirlerin alınması.

Kişisel Verilerin Korunması Kanunu’nun 4 üncü ve 12 nci maddelerinde yer alan bu hükümler uluslararası boyutta da benimsenen kurallardır.

Lessthanone-shot yöntemi ile daha az veri işlenerek ölçüsüz veri işlemenin önüne geçilecek ve kişisel verilerin ihlal edilme olasılığı düşecektir. Ayrıca, veri sorumlusunun kişisel verilerin güvenliğini sağlamak ve onları saklamak için alması gereken tedbirler ve bunların masrafları da azalacaktır.

Waterloo Üniversitesi’nin raporuna buradan ulaşabilirsiniz:

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.

%d bloggers like this: