
A molekulakutató alkalmazás egy olyan – hatóanyagtervezéshez használható – eljárás, illetve termék, mely segítségével kiválaszthatóak a gyógyszerhatásért felelős legfontosabb molekuláris sajátságok, majd ezek analízisével egy úgynevezett farmakofor modell (QSAR (=kvantitatív szerkezet-hatás összefüggést leíró) egyenlet) alakítható ki. A modell lehetőséget nyújt „in silico screening”-re, azaz a számítógéppel modellezett, rendelkezésre nem álló, vagy még nem is létező molekulák biológiai tulajdonságainak becslésére.
Az „in silico screening” kialakítása, és a jelenlegi módszerek algoritmikus tartalmának felülvizsgálata lehetőséget nyújtott arra, hogy új, a jelenlegi termékekhez képest jelentősen kedvezőbb tulajdonságokkal bíró megoldást hozzunk létre. Projektünk eredményeinek felhasználása révén a gyógyszerkutatással (is) foglalkozó vállalatok jelentős hatékonyságnövekedésre tehetnek szert pénzügyi- és emberi erőforrás-ráfordításaik, valamint kutatási időigényük csökkenése révén.
Jelenleg számos olyan termék létezik a piacon, melyek alapvető célja, hogy a kísérletek során mérhető hatást különböző hatóanyagokra megbecsülje. Azonban ezek funkcionalitása és hatékonysága elmarad az általunk kifejlesztett termékétől.
A jelenleg általánosan használt szoftverek csak nagyon hasonló szerkezetű molekuláknál becsülnek jól, ezen új termék azonban képes nagyon különböző szerkezetű molekulák biológiai hatását is megbecsülni, mivel a szerkezetből számolt tulajdonságok összességét vizsgálja, nem csak a szerkezeti hasonlóságokat. Ily módon a kísérleti anyagok előállítását megelőzően sor kerülhet a tervezett anyag biológiai hatásának becslésére, és csak a hatékonynak jósolt molekulák kerülnek előállításra.
A DSS terméke nem csupán a normál eloszlású deszkriptorok információ-sűrítési képességét képes helyesen becsülni, hanem a normál eloszlástól eltérőekét is. A korábbiakhoz képest így lehetségessé válik az intervallumok és diszkrét paraméter-mintázatok felhasználása, melynek révén nem szükséges a konformáció-függő deszkriptorok elhagyása a modellből, ami jelentős információ-vesztéssel jár.
A termék további újdonságtartalma, hogy nem csupán a hagyományos eljárások (többváltozós lineáris regresszió, legkisebb négyzetek módszere, neuron hálózatok, stb.) használatát biztosítja, hanem új, esetenként hatékonyabbnak bizonyuló eljárások (logisztikus regresszió, a valószínűségi és döntési hálók, stb.) használatát is lehetővé teszi.
Mivel a DSS jelentős tapasztalatokkal rendelkezik a statisztikai modellezés és a mesterséges intelligenciára épülő egyedi felhasználói igényeket kielégítő alkalmazások terén és mivel a fent említett terméket folyamatosan kívánjuk fejleszteni; ezért a célmolekulák kiválasztásárára szolgáló megoldások piacán termékünk meghatározójává válhat a terület továbbfejlesztési irányainak.
A QSAR (Quantitative Structure-Activity Relationships), a racionális hatóanyag-tervezés egyik nagy ága, amely a kémiai szerkezetek és az általuk kiváltott biológiai hatások összefüggéseivel foglalkozik.
A célpont-alapú (structure-based) hatóanyag-tervezés a célmolekula (általában enzim) struktúrájából kiindulva igyekszik meghatározni a hatékonyság kritériumait. Ennek a módszernek az alapja a célmolekula (vagy az aktív ligandum-kötőhely) struktúrájának meghatározása számítástechnikai (energetikai számításokon alapuló) és fizikai (röntgen-krisztallográfia, NMR) eszközökkel. Ha lehetséges, a célmolekulát a már ismert, hatékony gátlószerével komplexet képezve kristályosítják, így pontosabban meg tudják határozni a gátlás szempontjából fontos régiót és atomokat. A jól meghatározott kötőhelyhez aztán egy virtuális molekula-könyvtár (halmaz) elemeit sorban megpróbálják odakapcsolni (dokkolás), vagy közvetlenül a kötőhely elektrokémiai mintázatának felhasználásával igyekeznek komplementer kémiai struktúrákat tervezni. A teoretikus szűrést (in silico screening) természetesen a laboratóriumi biológiai mérés validálja. Ilyen jellegű szoftver a MOE (Chemical Computing Group) és a SYBYL (Tripos), de léteznek szuper-számítógépes, illetve nyílt forráskódú alkalmazások is.
A ligandum-alapú hatóanyag-tervezés azokban az esetekben ígéretesebb a fenti módszernél, amikor a célmolekula szerkezete (vagy tényleges térbeli struktúrája) nem ismert, esetleg a hatás vélhetően több célmolekulán keresztül valósul meg (multitarget effect). Ilyenkor a biológiai hatás nem csak közvetlen (pl. tisztított enzim aktivitásának mérése), hanem közvetett (pl. vírus-szaporodás mértéke) is lehet. Az első ciklusban néhány anyag hatását biológiai rendszerben mérik meg. Az anyagok kiválasztásának szempontjai: lehetőleg álljon rendelkezésre (olcsón, nagy mennyiségben), legyen elég nagy a kémiai diverzitás (hogy nagyon különböző kémiai csoportok esetén is legyenek adatok), lehetőleg tartalmazzák a szakirodalomban már leírt hatékony anyagokat is. A QSAR szerepe, hogy meghatározza az így tesztelt anyagok szerkezete és a mért biológiai hatás közötti összefüggést.
A QSAR eljáráshoz a struktúrákból származtatható numerikus értékekre van szükség, ezeket hívjuk deszkriptoroknak (leíróknak). A deszkriptorok száma elvileg végtelen, de a már publikált algoritmusok száma is igen nagy. A deszkriptorok számíthatók a 0D struktúrából: összegképlet (pl. oxigén atomok száma), az 1D struktúrából: konnektivitási index (pl. gyűrűk száma), a 2D struktúrából: adott atom- és kötés-típusok (pl. bejárási útvonalak), ill. 3D struktúrából: térbeli atom-koordináták (pl. oldószerrel érintkező felület). A magasabb dimenziójú struktúrából kiinduló deszkriptorok információ-tartalma magasabb, de egyben megbízhatóságuk csökken (izomerek, metastabil energetikai állapotok).
Deszkriptor számításra szinte bármilyen statisztikai, illetve matematikai szoftver alkalmas. Az ipari vezetőnek számító Dragon program kb. 2000 deszkriptort számol, de a Vichem vizsgálatai szerint ezek jelentős részét hibásan. Ugyanez a csoport MobyDig néven készített modell-építő szoftvert. A MOE (Chemical Computing Group) kb. 500 deszkriptort számol, ez SVL-szintaxisú programozással bővíthető. A Vichem által kifejlesztett PMCS (Professional Molecular Communication System) 5400 deszkriptort számol (hisztogrammokat is beleszámítva: 53300), szerver által vezérelt kliensekre szétosztott számítási módszerrel.
A PMCS-ben kb. 10 500 000 különböző struktúra van, amelyek az üzleti szféra cégeinek katalógusaiból, szakirodalmi adatokból és saját anyaggyártási adatokból származnak. Ez a szám alkalmas arra, hogy a deszkriptorok statisztikai megoszlását vizsgálhassuk heterogén struktúra-halmazon.
A deszkriptor-értékek bemenő adatát képezik a modell-építésnek, amely ezekkel mint X-, a mért biológiai hatással mint Y-értékkel operál. A biológiai hatást legtöbbször a teoretikus 50%-os hatáshoz (a gátlási profil inflexiós pontja) szükséges mikromoláris koncentráció (IC50) negatív tízes-alapú logaritmusaként (pIC50) szokás megadni, ez persze leginkább az enzim-gátlások szignoid-lefutású gátlási profiljára jellemző. A modellépítés és optimalizálás során szükséges a nagyszámú deszkriptor mennyiségét csökkenteni, illetve a maradék releváns halmaz megfelelő matematikai függvényét megalkotni, amely új struktúrák esetén is jól becsüli a biológiai hatást. A modellépítésre jelenleg legtöbbször az MLR (multiple linear regression), a PLS (partial least square), illetve az ANN (artificial neural network) módszereket alkalmazzák.
Mivel a modell-építés igen számítás- és idő-igényes, ezért a gyorsabb (lineáris) modellek a gyakrabban használatosak. A deszkriptorszámító algoritmusok nagy mennyisége ebből is fakad: a független „alap-deszkriptorok” magasabbrendű függvényeiből előálló számok a lineáris modellbe is becsempészik a nem-lineáris paramétereket.
Amennyiben a megfelelő becslési képességgel rendelkező modell a birtokunkban van, nagy számú struktúra esetén lehetséges ennek alapján a biológiai hatás becslése. Az ilyen módon legjobbnak ígérkező anyagok laboratóriumi biológiai tesztelésre küldhetők. Az ebből visszajövő adatok alkalmasak a modell további javítására-finomítására (optimalizációs ciklusok). A második (n-edik) tesztelési ciklus esetén az anyagok beválogatási szempontja lehet a diverzitás növelése is, azaz a teszt-halmaz deszkriptor-térben elfoglalt területének tágítása. A virtuális tesztelésre két stratégia van: az egyik csak az adott modellben szereplő deszkriptorok értékét számítja ki, majd ebből a modell által meghatározott módon a becsült biológiai hatást. Ez a számítógépes tárkapacitás szempontjából optimális, de a szűrési idő a deszkriptorok típusától függően igen nagy lehet. A másik stratégia szerint az összes struktúra összes deszkriptora kiszámításra és adatbázisban letárolásra kerül, amely a nagy tároló-igény mellett igen gyors (egy órán belüli) virtuális tesztelést tesz lehetővé bármilyen deszkriptor-tartalmú modell esetén.
A gyógyszerfejlesztés szempontjából egyéb szempontok is vannak, mint az adott célmolekula gátlása. Fontos, hogy a hatás specifikus legyen, tehát az egyéb (általában rokon-szerkezetű) célmolekulákra ne legyen jelentős hatása (hacsak a cél nem egy enzim-család gátlása). Modellek készíthetők az anyagok fizikokémiai (logP: víz/oktanol megoszlási hányados, oldhatóság, stb.) és biológiai (pl. toxicitás, mutagenitás, stb.) tulajdonságainak becslésére. A virtuális tesztelés során ígéretesnek mutatkozó anyagok ezen farmakológiai (ADME: Absorption Distribution Metabolism & Excretion) modellekkel is összevethetők, így a legjobbak választhatók ki. A kombinatorikai kémia eszköztárával generálhatók olyan molekula-könyvtárak, amelyek kiinduló- (szülő-) struktúrája a biológiai tesztben hatékony anyag: ennek kis változtatásokkal létrehozott származékai virtuális teszteléssel elő-szűrhetők.
A modell-építés igen nagyszámú adatot vizsgál. Az összes lehetséges kombináció és függvény száma végtelen, tehát nem egyszerű az eljárásnak belátható időn belül megtalálnia a lehetséges legjobb összefüggést. Fontos, hogy a modell mennyire tud ismeretlen struktúrák esetén biológiai hatást becsülni. A több tízezer dimenziós deszkriptor-térben valószínű, hogy az ismeretlen struktúrák valamely deszkriptor szempontjából túlmutatnak a modell-építés során használt anyagok deszkriptor-terén. Kérdés, hogy az extrapolálás milyen mértékig engedhető meg, és az eredeti deszkriptor tér szélső értékein belül maradó struktúrák mennyiben tekinthetők intrapoláltnak. Ha az ismert hatású anyagok deszkriptorainak érték-megoszlását is figyelembe vesszük, és a lefedettséget nem tekintjük folyamatosnak a szélső értékek között, akkor tovább szűkül azon struktúrák köre, amelyekre nagy biztonsággal becsülhetünk. A kezdeti (megmért) anyag-halmaz diverzitása a deszkriptor térben biztosan nagyon kicsi: ha az első ciklusban a 5000 deszkriptor alacsony-közepes-magas értékeit hordozó struktúrákat szeretnénk tesztelni, akkor ez 102400 körüli anyagot jelentene.
Az egyik legfontosabb problémája a QSAR-nak, hogy sem a célmolekula aktív, természetes szerkezetét, sem a gátló anyagok valódi (hatékony) térbeli konformációját nem ismeri biztosan, csak energia-minimalizálási számítások alapján becsli. A hatékony struktúra lehet valamely metastabil energiaállapotú konformáció, vagy éppen egy instabil (de az adott enzimmel kötődve stabil) szerkezet. A 2D struktúrákból a lehetséges metastabil konformációk kiszámíthatók, ill. ezek deszkriptorai is meghatározhatók (vannak köztük konformáció-függők és –függetlenek is). Ha a virtuális tesztelés esetén egy teoretikusan megfelelő modell a konformációk bármelyikét megfelelőnek becsli, akkor az anyag is (idejének egy adott részében) megfelelő lesz. Az igazi nehézséget a modellépítés jelenti: a bemenő deszkriptor-értékek egy része konformáció-függő, tehát a lehetséges kombinációk száma ugrásszerűen megnő. A konformáció-függő deszkriptorok elhagyása a modellből jelentős információ-vesztéssel járna. Cél tehát egy olyan modellépítő eljárás megtalálása, amely a bemenő X-értékeknél intervallumokat, illetve diszkrét paraméter-mintázatokat (is) megenged.