Platforma MultiGenBank służy do gromadzenia, przetwarzania i udostępniania danych o polimorfizmach genetycznych, immunogenetycznych oraz mikrobiologicznych, czyli o szeroko pojętych różnicach występujących w DNA populacji. Odbiorcami platformy są przedstawiciele przemysłu – głównie farmaceutycznego oraz biotechnologicznego, nauki – ośrodki badawcze, jednostki medyczne oraz jednostki edukacji zlokalizowane na terenie całej Unii Europejskiej oraz poza jej granicami.
Zrealizowaliśmy kompleksowy projekt wykonania, implementacji oraz wdrożenia oprogramowania platformy MultiGenBank dla Instytutu Immunologii i Terapii Doświadczalnej im. Ludwika Hirszfelda.
Największym wyzwaniem w projekcie było osadzenie systemu informatycznego w obrębie dwóch wyspecjalizowanych, autonomicznych i niezależnych od siebie obszarach – immunogenetyki oraz mikrobiologii.
Moduł immunogenetyczny – ImGen – stanowi platformę umożliwiającą społeczności naukowej współdzielenie danych immunogenetycznych dotyczących polskiej populacji. Zasilany jest danymi dobrowolnie udostępnianymi przez każdego z użytkowników. Moduł posiada także mocno rozbudowany moduł analityczny, pozwalający na przeprowadzenie „zgodnie ze sztuką” obliczeń operujących na danych pochodzących z zasobów platformy, danych użytkownika umieszczanych tymczasowo w przestrzeni roboczej oraz mieszanych zbiorów danych.
Drugi z modułów – moduł mikrobiologiczny (MicroB) to baza danych umożliwiająca precyzyjne genotypowanie mikroorganizmów na poziomie gatunków, szczepów i izolatów. Moduł pozwala na wyszukiwanie i analizę mikroorganizmów pod kątem ich cech o znaczeniu użytkowym – przeszukiwanie zasobów możliwe jest poprzez standardowe zapytania z wykorzystaniem słów kluczowych, jak również zaawansowanie przeszukiwanie z wykorzystaniem narzędzi bioinformatycznych, porównujących sekwencje aminokwasowe lub nukleotydowe. Ważną cechą platformy jest stale monitorowana spójność danych z portalem Polskiej Kolekcji Mikroorganizmów - The Polish Collection of Microorganisms (PCM) oraz innymi bazami mikrobiologicznymi. W ramach platformy uruchomiliśmy również innowacyjne narzędzie do biologii syntetycznej – SynKeD (Synthetic polyKetide Designer), pomocne w projektowaniu hybrydowych modułowych syntaz poliketydowych typu I do syntezy nowych poliketyd.
Technologie, które wykorzystaliśmy w trakcie realizacji projektu:
- Baza: PostgreSQL
- Język: Python
- Framework: Django
- Wyszukiwarka: Elastisearch
- Serwer www: Nginx
- System operacyjny: Linux (Ubuntu).