Bir kişinin diyabet ve kanser gibi hastalıklara yatkınlığını ölçen istatistikler, altta yatan genetik verileri ortaya çıkarmak için tersine mühendislik yapılabilir ve bu da mahremiyet endişelerine yol açabilir

Belirli koşullara ilişkin riskinizi tahmin etmek için genetik veriler analiz edilebilir
Bir kişinin belirli sağlık koşullarına yakalanma olasılığını özetleyen genetik risk puanları, kişinin DNA’sı hakkındaki gizli ayrıntıları ortaya çıkarmak için matematiksel hileler yoluyla kullanılabilir.
Yöntem teorik olarak sağlık sigortacıları tarafından özet genomik rapordan genetik verileri yeniden oluşturmak ve hasta tarafından açıklanmayan sağlık risklerini ortaya çıkarmak için kullanılabilir. Alternatif olarak, puanlarını anonim olarak paylaşan kişiler, genetik veriler çıkarılarak ve halka açık şecere veritabanları sorgulanarak belirlenebilir.
Poligenik risk puanları, tek nükleotid polimorfizmleri (SNP’ler) olarak bilinen, genomdaki onlarca ila binlerce bireysel harf varyasyonunun etkisini ölçer. Araştırmacılar ve 23andMe gibi DNA testi şirketleri tarafından potansiyel sağlık risklerini özetlemek için kullanılan puanlar bazen, örneğin puanlarının yorumlanması konusunda tavsiye isteyen kişiler tarafından kamuya açık olarak paylaşılır.
Poligenik bir risk puanının paketini açmak, yalnızca rakamların toplamının 52 olduğunu bilerek bir telefon numarası bulmaya çalışmak gibidir. Bu, hesaplama açısından zor olduğu bilinen matematikteki sırt çantası probleminin bir örneğidir. Bu nedenle puanlar düşük gizlilik riski olarak görülüyor.
Bununla birlikte, bir risk skorunda kullanılan her SNP değeri, genel hastalık riskine katkısını yansıtan son derece hassas bir ağırlıkla (en fazla 16 hane uzunluğunda) çarpılır. Bu, küçük risk modellerini saldırılara karşı savunmasız hale getirir.
New York’taki Columbia Üniversitesi’nden Gamze Gürsoy, “Nihai poligenik risk puanı, bu sayıya ulaşabileceğiniz sınırlı sayıda yolla ve altta yatan SNP’lerin istatistiksel olarak olası bir düzenlemesiyle sınırlandığından, yüksek derecede doğrulukla çıkarılabilir” diyor.
Yine Columbia’dan Gürsoy ve Kirill Nikitin, 2353 kişiden alınan genetik veriler üzerinde 50 veya daha az SNP kullanan 298 poligenik risk modelini çalıştırdı. Geriye doğru çalışarak, her bir puanı üretebilecek tüm olası genomları hesapladılar ve pek çok nadir mutasyona sahip olanları filtrelediler.
Bir SNP birden fazla poligenik risk modeli tarafından kullanılabildiğinden Gürsoy ve Nikitin, daha büyük modellerin çözülmesine yardımcı olmak için daha küçük modellerin ortaya çıkardığı SNP’leri kullanarak saldırılarını zincirleme yapmayı başardılar.
Donör genotipini yüzde 94,6 doğrulukla yeniden yapılandırmayı başardılar ve birey başına 2450 SNP’yi doğru bir şekilde tahmin ettiler. Testler, yarım milyon örnekten oluşan bir havuzdaki bir kişiyi tanımlamak için 27 SNP’nin yeterli olduğunu ve aile üyelerinin yüzde 90’a varan hassasiyetle tahmin edilebildiğini gösterdi. Afrika ve Doğu Asya kökenli bireyler, genetik veritabanlarında daha az temsil edildikleri için daha kolay tanımlanabildi.
Gürsoy’a göre, poligenik puanların yer aldığı halka açık bir veri tabanındaki 447 küçük, yüksek hassasiyetli model, bu saldırıya karşı savunmasız durumda.
Gürsoy, “Riskin düşük olduğunu ancak (bazı koşullar) altında hala bir miktar sızıntı olabileceğini belirtmek istedik” diyor. “Araştırma çalışmalarını tasarlarken bunu dikkate almalıyız, özellikle de savunmasız popülasyonları dahil ediyorsak.”
Massachusetts Genel Hastanesi’nden Ying Wang, mevcut veri korumalarının ve hesaplama darboğazlarının poligenik risk puanlarının bu şekilde istismar edilmesi riskini sınırladığını söylüyor. “Sonuçlar, küçük modellerin klinik raporlamada ve bilgilendirilmiş onam tartışmalarında potansiyel olarak hassas veriler olarak ele alınması gerektiğine dair bir uyarı olabilir” diyor.



