Umelá inteligencia v genetike mapuje interakcie génov v bunkách

Artificial intelligence in genetics dokáže dnes identifikovať kľúčové gény v regulačných sieťach bez ľudského dohľadu. Model sa učí úplne samoučiacim spôsobom venovať pozornosť génom, ktoré sú centrálne v génových regulačných sieťach, a dokáže identifikovať potenciálne interakcie predstavujúce nové terapeutické ciele. V tomto článku preskúmame, ako artificial intelligence in clinical genetics mapuje terapeutické ciele pri srdcových ochoreniach, aké applications of artificial intelligence in genetics nachádzame v spatial transcriptomics a rakovinovom výskume, ako artificial intelligence in human genetics odhalila približne 90 000 génových interakcií medzi štyrmi miliónmi skúmaných génových párov, a rovnako ako artificial intelligence in plant breeding zlepšuje plodiny.

Ako umelá inteligencia identifikuje interakcie medzi génmi

Systém Geneformer učí sa z miliónov buniek

Model Geneformer vyvinuli vedci z Broad Institute pri MIT a Harvard s cieľom naučiť sa dynamiku génových sietí z rozsiahlych transkriptómových dát. Systém bol pretrénovaný na dátach z približne 30 miliónov ľudských jednobuňkových transkriptómov pochádzajúcich z rôznych ľudských tkanív. Architektúra modelu pripomína BERT-like transformer, ktorý využíva mechanizmus pozornosti na zameranie sa na najrelevantnejšie časti vstupných dát.

Geneformer sa učí úplne samoučiacim spôsobom bez potreby označených dát. Konkrétne, počas predtrénovania používa techniku maskovania jazykového modelovania, pri ktorej časť génových expresných dát zamaskuje a model sa naučí predikovať zamaskované gény na základe okolitého kontextu. V dôsledku toho model získava fundamentálne pochopenie sieťovej dynamiky a kóduje hierarchiu sietí v attention váhach modelu.

Transfer learning umožňuje predikcie pri nedostatku dát

Transfer learning predstavuje kľúčovú schopnosť Geneformer, ktorá umožňuje prenos predchádzajúceho učenia o ľudských génových sieťach na modelovanie sietí v nových situáciách, kde sú genomické dáta obmedzené. Model dokáže rekonštruovať dôležitú génovú sieť v srdcových endotelových bunkách rovnako presne pri použití iba 5 000 buniek ako predchádzajúce metódy trénované na viac ako 30 000 bunkách. Navyše, Geneformer dosahuje presnosť vyššiu ako 90% pri úlohách klasifikácie špecifických typov buniek.

Kontextová pozornosť modelu umožňuje predikcie špecifické pre každý bunečný kontext. Génové embedding sú robustné voči sekvenačnej platforme a metóde konzervácie, avšak závisia od kontextu ostatných génov exprimovaných v bunke.

Virtuálne testovanie génových sietí v simulovanom prostredí

In silico modelovanie kombinuje výhody in vivo aj in vitro experimentovania a umožňuje skúmať biologické procesy ako homeostázu či evolúciu. Geneformer používa in silico deléciu na identifikáciu génov, ktorých odstránenie má škodlivý efekt v konkrétnom bunkovom kontexte. Dynamické systémy poskytujú prirodzený jazyk pre skúmanie komplexných biologických systémov vykazujúcich nelineárne priestorovo-časové správanie. Následne môžu výskumníci použiť tieto predikcie na navrhovanie laboratórnych experimentov a klinických štúdií pre testovanie nových terapeutických modalít.

Artificial Intelligence in Clinical Genetics mapuje terapeutické ciele

Kardiomyopatia ako prvý testovací prípad

Srdcová amyloidóza a hypertrofická kardiomyopatia predstavujú diagnostickú výzvu pre kardiológov kvôli podobným nálezom na echokardiografických vyšetreniach. Presne identifikovať tieto dva stavy je náročné aj pre skúsených odborníkov a určiť správnu diagnózu často trvá roky až desaťročia. Algoritmus artificial intelligence in clinical genetics dokáže zachytiť veľmi jemné podnety na ultrazvukových záberoch, ktoré rozlišujú závažné stavy od benígnych ochorení. Dvojkrokový algoritmus bol použitý pri viac než 34 000 ultrazvukových vyšetreniach srdca a dokázal identifikovať špecifické rysy ochorenia v závislosti od hrúbky srdcových stien a veľkosti srdcových komôr.

Identifikácia génov pre zlepšenie funkcie srdcových buniek

Vedci z University of East London pestujú srdcové bunky v laboratóriu na vývoj nástroja s umelou inteligenciou, ktorý dokáže rýchlejšie odhaliť srdcové ochorenia. Regeneračná schopnosť srdca je extrémne obmedzená. Regeneruje sa len 1 percento srdcových buniek, a keď dosiahneme 80 rokov, táto schopnosť klesne o polovicu. V rámci aplikácií artificial intelligence in genetics sa výskumný tím pokúša napodobniť funkciu srdca pri čerpaní krvi tým, že sa pozerá na sériu systol a diastol a meria ich rýchlosť a vzor. Spoločnosť DeepMind použila systém AlphaMissense na identifikáciu génov v ľudskej DNA, ktoré by mohli spôsobiť choroby, pričom zachytili 89 percent zo všetkých kľúčových mutácií.

Predikcia účinkov odstránenia génov na chorobný stav

Oxfordskí vedci vyvinuli nástroj, ktorý dokáže analyzovať bežné CT snímky srdca a odhaliť riziko zlyhania srdca ešte dávno pred prvými príznakmi s presnosťou približne 86 percent. Výskum zahŕňal viac ako 70-tisíc pacientov sledovaných počas desiatich rokov. Ukázalo sa, že ľudia s najvyšším rizikom mali až 20-násobne vyššiu pravdepodobnosť, že sa u nich rozvinie srdcové zlyhanie. Na základe fyziologických zmien, ktorými srdcové bunky časom prechádzajú, možno predpovedať, ktoré srdcia budú starnúť zdravo a ktoré chorobne.

Výhody in silico analýzy oproti laboratórnym testom

Technológia využíva vyšetrenia, ktoré sa už dnes bežne robia, pričom CT snímky srdca absolvujú stovky tisíc pacientov ročne. Applications of artificial intelligence in genetics dokážu vyťažiť z existujúcich dát oveľa viac informácií bez potreby nových vyšetrení. Včasné odhalenie rizika umožňuje lekárom zasiahnuť skôr, napríklad úpravou liečby alebo životného štýlu.

Aplikácie umelej inteligencie v ďalších oblastiach genetiky

Spatial transcriptomics odhaľuje génovú aktivitu z mikroskopu

Priestorová transkriptomika prepája analýzu génovej expresie na úrovni mRNA molekúl s ich priestorovým usporiadaním v tkanivách. Na rozdiel od konvenčných sekvenovacích metód poskytuje komplexnejší obraz o architektúre tkaniva a organizácii buniek. Technológia spája sekvenovanie RNA s zobrazovaním vo vysokom rozlíšení, pričom rezy tkaniva sa umiestnia na špeciálne sklíčka s čiarovými kódmi, ktoré zachytávajú RNA zo svojho bezprostredného okolia. Vedci z St. Jude Children’s Research Hospital vyvinuli nástroj Spotiphy, ktorý aplikuje strojové učenie na dosiahnutie jednobuňkového rozlíšenia a pokrytia celého genómu súčasne. V rakovinovom výskume priestorová transkriptomika odhaľuje heterogenitu nádorov a identifikuje terapeutické ciele.

Applications of Artificial Intelligence in Genetics pre rakovinu

Vedci z MIT v spolupráci s Dana-Farber Cancer Institute vytvorili počítačový model OncoNPC, ktorý dokáže analýzou sekvencií približne 400 génov odhadnúť, kde v tele vznikol nádor. Model bol trénovaný na dátach približne 30 000 pacientov s 22 známymi typmi rakoviny. V prípade nádorov s vysokou pravdepodobnosťou odhadu mal až 95-percentnú úspešnosť. Genetické laboratóriá na Slovensku využívajú špecializovaný softvér s umelou inteligenciou, ktorý významne skracuje čas analýzy.

Artificial Intelligence in Plant Breeding zlepšuje plodiny

Startup Avalo z USA využíva algoritmy na predpovedanie vlastností semien bez pestovania, čím zrýchľuje šľachtenie až o 70 percent. Spoločnosť dokáže uviesť novú odrodu na trh za štyri až päť rokov namiesto desaťročí. Prvý komerčný produkt, plne jedlé brokolicové odrody, plánujú uviesť v roku 2026. Mníchovsky startup NoMaze umožňuje šľachtiteľom simulovať vlastnosti plodín v digitálnom prostredí ešte predtým, než sa dostanú na pole.

Mapovanie 90 000 génových interakcií v ľudských bunkách

Artificial intelligence in human genetics odhalila rozsiahle siete génových interakcií v bunkových systémoch, pričom model dokáže identifikovať potenciálne interakcie predstavujúce nové terapeutické ciele bez potreby ľudského dohľadu.

Výzvy a budúcnosť AI v genetickom výskume

Obmedzenia súčasných modelov pri modelovaní komplexných sietí

Súčasné modely artificial intelligence in genetics sa stretávajú s významnými prekážkami pri mapovaní komplexných génových interakcií. AlphaMissense dokáže pri 90-percentnej presnosti predpovedať, že 57 percent missense mutácií je pravdepodobne neškodných a 32 percent pravdepodobne škodlivých. Avšak zostávajúca časť mutácií predstavuje neistú zónu, kde modely nedokážu poskytnúť jednoznačné odpovede. Qubity sú mimoriadne citlivé na vonkajšie vplyvy ako teplota, žiarenie či magnetické polia, pričom aj najmenšie rušivé vplyvy dokážu skresliť výpočty.

Potreba väčších datasetov pre presnejšie predikcie

Trénovanie artificial intelligence in clinical genetics vyžaduje obrovské množstvo dát. Elon Musk v nedávnom rozhovore pronesl, že v loňskom roku ľudstvo vyčerpalo dostupné trénovacie dáta a pre ďalší pokrok bude potrebné nasadiť syntetické dáta vytvorené počítačmi. Niektorí vedci varujú, že to môže viesť k postupnému kolapsu AI modelov, ktoré sa stanú menej kreatívnymi a viac predpojatými, keďže sa neustále budú utvrzovať vo skresleniach daných pôvodnou trénovacou množinou. Agentúry predpokladajú, že Microsoft, Meta, OpenAI či Anthropic už dnes používajú približne 60 percent syntetických dát.

Integrácia kvantového počítania do génových analýz

Wellcome Sanger Institute v spolupráci s univerzitami v Oxforde, Cambridge a Melbourne načítal genóm vírusu hepatitídy D do kvantového počítača IBM vybaveného 156-qubitovým procesorom Heron. Kombinácia kvantového počítania a strojového učenia prináša nové perspektívy vo vývoji artificial intelligence in human genetics, keďže učiace sa algoritmy by mohli byť trénované rýchlejšie a efektívnejšie identifikovať vzory. Súčasné systémy však vyžadujú špeciálne chladiace zariadenia na dosiahnutie teplôt blízkych absolútnej nule, čo spôsobuje, že ich výroba a prevádzka sú extrémne nákladné.

Záver

Umelá inteligencia v genetike transformuje spôsob, akým rozumieme génovým interakciám a chorobným procesom. V skutočnosti systémy ako Geneformer dokážu mapovať tisíce génových vzťahov bez ľudského dohľadu, pričom identifikujú nové terapeutické ciele pri srdcových ochoreniach aj rakovine. Rozhodne vidíme potenciál v spatial transcriptomics a šľachtení plodín. Napriek súčasným obmedzeniam modelov a potrebe väčších datasetov predstavuje integrácia kvantového počítania sľubný krok vpred v génových analýzach.