[001][Sekwencja DNA]

PYTANIE : Mam bazę danych 3190 instancji DNA składającą się z 60 ekwiwalentnych pozycji nukleotydowych DNA sklasyfikowanych według 3 typów: EI, IE, Inne. Chcę sformułować nadzorowany klasyfikator. Moje obecne podejście polega na sformułowaniu macierzy przejścia Markowa drugiego rzędu dla każdej instancji i zastosowaniu uzyskanych danych do sieci neuronowej. Jak najlepiej podejść do tego problemu z klasyfikacją, biorąc pod uwagę, że sekwencja danych powinna być odpowiednia? Czy istnieje lepsze podejście niż to, które wymyśliłem?

ODPOWIEDŹ : Jednym ze sposobów byłoby utworzenie 20 obiektów (każda funkcja reprezentuje kodon). W ten sposób powstałby zestaw danych z 3190 instancjami i 20 kategorycznymi funkcjami. Nie ma potrzeby traktowania sekwencji jako łańcucha Markowa. Po przygotowaniu zestawu danych, jak zasugerowano powyżej, każdy nadzorowany klasyfikator może działać dobrze. Sugerowałbym użycie maszyny zwiększającej gradient, ponieważ może ona lepiej nadawać się do obsługi funkcji jakościowych

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *