Изследване на изкуствен интелект на човешкия геном открива неизвестен човешки предшественик

Може ли умовете на машините да ни научат нещо ново за това какво означава да си човек? Когато става въпрос за сложната история на сложния произход и еволюцията на нашия вид, изглежда, че те могат. Едно скорошно проучване използва технология за машинно обучение, за да анализира осем водещи модела на човешкия произход и еволюцията, и програмата идентифицира доказателства в човешкия геном на „призрачната популация“ на човешките предци. Анализът показва, че една неизвестна и отдавна изчезнала група хоминини се е кръстила с Homo sapiens в Азия и Океания някъде по дългия, криволичещ път на човешката еволюционна история, оставяйки след себе си само фрагментирани следи в съвременната човешка ДНК. Изследването, Nature Communications , е един от първите примери за това как машинното обучение може да помогне за разкриване на улики за нашия произход. Чрез изучаване на огромни количества геномни данни, оставени от вкаменелите кости и сравнявайки ги с ДНК в съвременните хора, учените могат да започнат да запълват някои от пропуските в еволюционната история на нашия вид. В този случай резултатите изглежда съвпадат с теориите на палеоантропологията, които са разработени от изучаването на вкаменелостите на предците, открити в земята. Новите данни показват, че мистериозният хоминин вероятно е произлязъл от смесване на неандерталци и денисовици (които бяха ). Такъв вид в нашето еволюционно минало ще прилича много на вкаменелостта на 90 000-годишна тийнейджърка от пещерата Денисова в Сибир. Нейните останки са , с неандерталска майка и баща на Денисован. „Това е точно този вид индивид, който очакваме да намерим в основата на тази популация, но това не трябва да бъде само един човек, а цялото население“, казва съавторът на изследването , еволюционен биолог в университета Pompeu Fabra в Барселона. Способността на ранните хора да се приспособят към променящите се условия в крайна сметка дадоха възможност на най-ранните видове Homo да варират, да оцелеят и да започнат да се разпространяват от Африка до Евразия преди 1,85 милиона години. (С любезното съдействие на Антон, Потс и Айело (2014), Science 345 (6192)) Предишни изследвания на човешкия геном разкриха, че след като съвременните хора са напуснали Африка, може би , впоследствие те са се кръстосвали с видове като неандерталците и денисовите, които съжителстват с ранните съвременни хора преди да изчезнат. Но преначертаването на нашето родословно дърво, за да се включат тези различни клонове, е трудно. Доказателствата за „призрачните“ видове могат да бъдат оскъдни и съществуват много конкуриращи се теории, които обясняват кога, къде и колко често хомо сапиенс би могъл да се е кръстил с други видове. Следи от тези древни междувидови връзки, наречени интрогресии, могат да бъдат идентифицирани като места на дивергенция в човешкия геном. Учените наблюдават повече разделение между две хромозоми, отколкото бихте очаквали, ако и двете хромозоми са от един и същ човешки вид. Когато учените през 2010 г., те осъзнали, че някои от тези различия представляват . Проучванията показват също, че някои живи хора могат да проследят . „И така, помислихме, че ще се опитаме да намерим тези места с висока дивергенция в генома, да видим кои са неандерталците и кои са Денисован, и след това да видим дали те обясняват цялата картина“, казва Бертранпет. „Както се случва, ако извадиш неандерталските и денисовите части, все още има нещо в генома, което е много различно.“ Идентифицирането и анализирането на много различни места в генома и изчисляването на безбройните генетични комбинации, които биха могли да ги произведат, е твърде голяма работа за хората да се справят сами, но това е задача, която може да бъде направена специално за дълбоки алгоритми на обучение. Дълбокото обучение е вид изкуствен интелект, при който алгоритмите са предназначени да работят като изкуствена невронна мрежа или програма, която може да обработва информация по същия начин, както би могъл и мозъкът на бозайник. Тези системи за машинно обучение могат да откриват модели и да отчитат предишната информация, за да могат да учат, като им позволяват да изпълняват нови задачи или да търсят нова информация, след като анализират огромни количества данни. (Най-често срещаният пример е , който може да се научи да „Дълбокото учене е по-сложно оформено нещо, което се вписва в набор от точки в по-голямо пространство“, казва . – Вместо да приспособяваме линия между Y и X, вие подхождате към нещо, което е много по-голямо, хилядомерно пространство. Дълбокото учене казва: „Не знам каква форма трябва да пасне на тези точки, но нека видим какво ще се случи.“ В този случай, машините бяха настроени да работят, анализирайки човешкия геном и предсказвайки човешката демография, като симулираха как нашата ДНК може да се е развила в продължение на хиляди възможни сценарии на древна еволюция. Програмата отчита структурата и еволюцията на ДНК, както и моделите на човешката миграция и кръстосване, за да се опита да подреди някои от парчетата заедно в един невероятно сложен пъзел. Изследователите обучиха компютъра да анализира осем различни модела на най-правдоподобните теории за ранната човешка еволюция в Евразия. Моделите идват от предишни проучвания, които се опитват да излязат с сценарий, който би довел до настоящата картина на човешкия геном, включително известните му неандерталски и денисовиански компоненти. „Разбира се, може да има и други модели, но тези модели са тези, които други хора предлагат в научната литература“, казва Бертранпет. Всеки модел започва с приетото извън Африка събитие, след което има различен набор от най-вероятните разделяния между човешки родове, включително различни кръстосвания с познати видове и възможни видове „призрак“. Хората или Homo sapiens са произлезли от сложно дърво на изправени предшественици, включително видове от родовете Ardipithecus , Australopithecus и Paranthropus . (Програма за човешки произход на Смитсониън) „С всеки един от тези осем модела изчисляваме за седмици изчисления колко добре са в състояние да достигнат действителния генетичен състав на хората“, казва Бертранпет. „Всеки път, когато правим симулация, това е симулация на възможен път на човешката еволюция и ние ги пускаме хиляди пъти, а дълбоките алгоритми за учене могат да разпознаят кой от моделите най-добре отговаря на данните.“ Сключването на машината? Един вид прародител присъства в нашето потекло, което ние все още не сме идентифицирали. „Досега единствените модели, които тествахме, които наистина са подкрепени от данните, са тези, които имат тази интрогресия на призрачната популация“, казва Бертранпет. Интригуващото проучване и други подобни могат да помогнат за преначертаването на картата за това как хората са мигрирали и еволюирали през онова, което изглежда е все по-сложен древен свят в Евразия и Океания. „Това със сигурност е интересно и в съответствие с възникващата картина на сложна ретикулирана филогения в човешката еволюция“, казва С появата на нови изкопаеми открития в тази област, сега актуализираните модели могат да бъдат тествани срещу човешкия геном с помощта на тези видове програми. Шрайбер казва, че силата на дълбокото учене за изучаване на човешкия произход се крие именно в способността му да анализира сложни модели. „Ако искате да направите изключително подробен модел, защото сте антрополог и искате да знаете дали тази интрогресия е станала преди 80 000 години или преди 40 000 години, това е силата на един дълбок подход на учене като този.“ Колкото и сложни да са, кръстосването на древната Евразия е все още само част от нашата човешка история. Bertranpetit вярва, че бъдещият напредък в дълбокото обучение може да помогне да се открият други нови глави. „Този метод на анализ ще има всякакви нови резултати“, казва той. „Сигурен съм, че хората, работещи в Африка, ще открият изчезнали групи, които все още не са признати. Без съмнение Африка ще ни покаже изненадващи неща в бъдеще. “
2019-02-09 14:58:39
http://www.smithsonianmag.com/science-nature/artificial-intelligence-study-human-genome-finds-unknown-human-ancestor-species-180971436/