ImageNet

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

База данных ImageNet — проект по созданию и сопровождению массивной базы данных аннотированных изображений, предназначенная для отработки и тестирования методов распознавания образов и машинного зрения. По состоянию на 2017 год в базу данных было записано более четырнадцати миллионов URL с изображениями, которые прошли ручную аннотацию для ImageNet, в аннотациях перечислялись объекты, попавшие на изображение, и прямоугольники с их координатами.[1] База данных с аннотацией и URL изображений от третьих лиц доступна непосредственно через ImageNet, но при этом сами изображения не принадлежат проекту[2]. С 2010 года ведётся проект ILSVRC (англ. ImageNet Large Scale Visual Recognition Challenge — Кампания по широкомасштабному распознаванию образов в ImageNet), в рамках которого различные программные продукты ежегодно соревнуются в классификации и распознавании объектов и сцен в базе данных ImageNet.

Состав базы данных[править | править код]

ImageNet использует краудсорсинг для аннотирования изображений.

Аннотации на уровне самих изображений показывают наличие или отсутствие объекта данного класса (например, «на картинке имеется тигр» или «на картинке нет тигров»). На уровне объекта в аннотацию включается прямоугольник с координатами видимой части объекта. ImageNet использует вариант семантической сети WordNet для категоризации объектов, которая достаточно детализирована, например, породы собак представлены 120 классами. Каждому узлу сети WordNet сопоставлены сотни или тысячи изображений, но в среднем на 2016 год — около 500 изображений[3].

На август 2017 года в ImageNet 14 197 122 изображения, разбитых на 21 841 категорию.

Кампания ImageNet[править | править код]

С 2010 года в рамках проекта ILSVRC проводятся соревнования между исследовательскими группами по классификации объектов. ILSVCR возникла по аналогии с небольшой кампанией 2005 года PASCAL VOC, которая располагала набором из 20 тысяч изображений и 20 классов объектов[3]. Существенный прогресс в распознавании образов был достигнут в 2010 году. В 2011 году хорошим результатом считалась ошибка классификации 25 %. В 2012 году система глубокого обучения на основе свёрточной нейронной сети смогла достичь 16 % ошибки; а в следующие годы ошибка упала до нескольких процентов[4]. В 2015 году исследователи констатировали, что программы в определённых задачах проекта ILSVRC превзошли человеческие способности[5]. Однако, как указывала Ольга Руссаковская, одна из организаторов кампании, программы пока должны определять объекты для одной из тысячи категорий, а люди могут распознать большее количество категорий и (в отличие от программ) могут ещё и обозначить контекст изображений[6].

В 2014 году к кампании подключилось более 50 организаций[3]. В 2015 году исследователей из проекта Baidu дисквалифицировали на год, потому что они вошли в проект под несколькими разными именами, чтобы обойти ограничения по двум поставкам в неделю[7][8]. Позднее Baidu заявило, что руководитель группы был уволен, и что будет собрана специальная научно-консультативная группа[9].

См. также[править | править код]

Примечания[править | править код]

  1. ImageNet Summary and Statistics. ImageNet. Дата обращения: 22 июня 2016. Архивировано из оригинала 20 марта 2019 года.
  2. ImageNet Overview. ImageNet. Дата обращения: 22 июня 2016. Архивировано из оригинала 4 июля 2016 года.
  3. 1 2 3 Olga Russakovsky*, Jia Deng*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg and Li Fei-Fei. (* = equal contribution) ImageNet Large Scale Visual Recognition Challenge. IJCV, 2015.
  4. Robbins, Martin (2016-05-06). "Does an AI need to make love to Rembrandt's girlfriend to make art?". The Guardian. Архивировано из оригинала 17 июня 2016. Дата обращения: 22 июня 2016.
  5. Markoff, John (2015-12-10). "A Learning Advance in Artificial Intelligence Rivals Human Abilities". The New York Times. Архивировано из оригинала 17 апреля 2016. Дата обращения: 22 июня 2016.
  6. Aron, Jacob (2015-09-21). "Forget the Turing test – there are better ways of judging AI". New Scientist. Архивировано из оригинала 13 апреля 2016. Дата обращения: 22 июня 2016.
  7. Markoff, John (2015-06-03). "Computer Scientists Are Astir After Baidu Team Is Barred From A.I. Competition". The New York Times. Архивировано из оригинала 23 мая 2016. Дата обращения: 22 июня 2016.
  8. "Chinese search giant Baidu disqualified from AI test". BBC News. 2015-06-14. Архивировано из оригинала 17 августа 2016. Дата обращения: 22 июня 2016.
  9. "Baidu fires researcher involved in AI contest flap". PCWorld. 2015-06-11. Архивировано из оригинала 28 августа 2016. Дата обращения: 22 июня 2016.

Ссылки[править | править код]