Skłodowski Mateusz
Zakład Chemii Teoretycznej i Strukturalnej
Pracownia Teorii Biopolimerów
Sekwencyjna klasyfikacja struktur białek metodą hierarchiczną
Mateusz Skłodowski
Promotor: dr hab. Dominik Gront, prof. ucz.
Opiekun: mgr Joanna M. Macnar
Białka są tematem wzmożonych badań naukowych od wielu lat. Szczególnie w ostatnim czasie liczba opublikowanych struktur znacząco wzrasta [1]. Przyrost ten nie jest jednak regularny pod względem różnorodności sekwencji, w związku z czym niektóre rodziny białkowe są dużo lepiej poznane niż inne.
Konsekwencją tego zjawiska jest nadreprezentacja niektórych motywów w statystykach strukturalnych baz danych. Jednym z możliwych rozwiązań tego problemu jest uwzględnianie tylko części białek do statystyk. W tym celu z rodziny białek wybiera się reprezentantów całych grup tworząc nową bazę struktur zwaną „non redundant” [2]. Drugim możliwym podejściem jest wprowadzenie wag celem uwzględnienia istotności wkładu danej struktury do statystyk. Pozwala to usunięcie na wyżej wspominanych tendencji przy jednoczesnym zachowaniu unikatowych motywów sekwencyjnych. To podejście [3] zostało przyjęte w naszej pracy.
Celem uzyskania wag sprawdzono identyczność struktur za pomocą uliniowienia sekwencji. Następnie, korzystając z metod analizy skupień [4], stworzono grupy białek wykazujących podobieństwo sekwencyjne. Z każdego zgrupowania wybierany jest reprezentant, a jego porównanie z każdym z białek z tego zbioru zapamiętane zostaje za pomocą wagi. Nasze podejścia zamierzamy zastosować do stworzenia biblioteki szablonów do modelowania porównawczego korzystając z reprezentantów każdego ze skupień.
Literatura:
[1] Berman H. M. et al., Nucleic Acids Res. 2000, 28, 235-242.
[2] Barker W. C. et al., Nucleic Acids Res. 1999, 22(17), 3569-3573.
[3] Yanover C., Vanetik N., Levitt M., Kolodny R., Keasar C., Bioinformatics, 2014, 30(16), 2295-2301.
[4] Murtagh F., Contreras P., Wiley Interdiscip. Rev. Data Min. Knowl. Discov., 2012, 2(1), 86-97.