Содержание
- 09 июня 2017 г.
- Технологии
По подсчетам MarketsandMarkets, глобальный рынок систем компьютерного зрения (подробнее об их работе – в материале Forbes) к 2020 году пройдет отметку в около $12,5 млрд, показывая ежегодный рост в более чем 9%. Аналитики компании Tractica сравнивают технологии компьютерного зрения с новичком-«квотербеком», который принес своей команде победу в чемпионате и, очевидно, принесет ей новые кубки и медали. Сегодня технологии компьютерного зрения (все те, которые позволяют машинам получать изображения объектов реального мира, интерпретировать их и принимать автономные решения на основе полученных данных) позволяют «видеть» промышленным роботам, первым беспилотным автомобилям, охранным системам и, например, «виртуальным примерочным», с которыми начинают экспериментировать ритейлеры. О том, как нейросети сделали компьютерное зрение одним из самых перспективных направлений искусственного интеллекта, как машины учатся распознавать окружающую реальность, Forbes поговорил с исследователем Жаном Понсом. Понс, автор трех книг по компьютерному зрению (самая известная, «Компьютерное зрение: современный подход», переведена на русский язык), профессор МIT и глава лаборатории computer science парижской Ecole Normale Supérieure, приехал на несколько дней в Москву на саммит «Машины могут видеть», организованный VisionLabs, венчурным фондом Sistema_VC и «Стрелкой».
Исследовательская группа Понса работает над тремя задачами. Во-первых, это разработка систем для «понимания» изображений и видео. Для этого нужно «узнать» объекты (например, отличить банан от собаки), действия (пьет ли человек воду или улыбается), элементы интерьера или экстерьера (скажем, фонари или шторы), а также научить систему «ориентироваться» — узнавать стены, улицы,небо и т.д. Во-вторых, группа Жана развивает решения для формирования 3D-изображений и моделирования сцен. Такие системы ученые отдают, например, археологам, ведущим раскопки в Помпеях, и голливудским режиссерам — для спецэффектов и постпродакшн. Третье направление работы — восстановление изображений и видео, когда первоначальные данные повреждены или очень «зашумлены».
Понс ведет исследования совместно с исследователями других групп в использовании алгоритмов машинного обучения, рассказывает Понс. Например, распознавание естественного языка может повысить качество распознавания видео: например, идентификацию смеха в видео сделать легче, если система определяет в качестве признака и звук, и положение рта. Пока системы компьютерного зрения определяют: на картинке — кошка, и для нее это только набор буквенных символов. Но вскоре мы сможем научить машины понимать, что «кошка» — это мяукающее существо на четырех лапах, прогуливающееся по двору. Работа исследователей машинного обучения именно с разными типами данных приведет нас к эре семантического анализа видео, уверен Понс.
Реклама на Forbes
— Каковы достижения технологий компьютерного зрения в последние годы? Об их прогрессе много говорят, вспоминая, например, то, как соцсети научились идентифицировать пользователей по загруженным фото или то, как в нашу жизнь вошли жестовые интерфейсы и автономные автомобили.
— Технологии искусственного интеллекта в целом переживают вторую волну развития в течение последних десяти лет. С 1960-х они проходили взлеты и падения. На какое-то время дискуссии затихали, потом возобновлялись снова. Но именно в последнее десятилетия мы видим огромное расширение возможностей их применения. В этом смысле то, как оценили достижения, например, Mobileye (компания разрабатывает хардверные и софтверные решения для беспилотников, приобретена Intel за $15 млрд — Forbes) показательно. Безусловно, компании в сфере рекламных технологий и соцсети тоже внесли вклад: теперь многие из загруженных в Facebook или Instagram фотографий попадают в выборку для обучения нейронных сетей. Системы анализируют снимки с Google Street View, спутниковые данные, информацию с камер в городах. То, что так быстро растет база изображений и видео для «тренирововк» действительно способствует успехам компьютерного зрения. Но все же основные проблемы развития технологий все еще остаются в академическом поле. Мы имеем дело с научными проектами, а не столько со все новыми задачами, выдвигаемыми бизнесом для создания все новых готовых решений. Мы решили базовые проблемы развития компьютерного зрения, но до широких индустриальных применений еще далеко. Корпорации открывают R&D-лаборатории, они вынуждены работать пока над исследовательскими проектами, а не сугубо коммерческими продуктами.
— Что можно считать индикатором столь быстрого прогресса систем компьютерного зрения?
— Если сопоставить то, что они умеют сейчас, и что они умели десять лет назад, мы увидим колоссальный рост сложности решаемых задач. В то время машины могли различать только общие контуры, разделить фон и объект. Теперь они умеют идентифицировать объекты разных классов в очень многодетальных изображениях. Например, теперь у нас есть методы обнаружения лиц, распознавания движений тех или иных черт лица. К тому же, сообщество разработчиков вводит «бенчмаркинг» — количественные критерии по точности и качеству распознавания, которые устанавливают в качестве требований для прохождения тестов различные исследовательские группы.
— Какие проблемы все еще предстоит решить?
— Сегодня системы компьютерного зрения используют в основном обучение с учителем. Такой подход предполагает, что для распознавания образов машины получают изображения или кадры видео, уже размеченные людьми. Нейросеть получает «правильный ответ»: действительно ли на фото, например, собака или банан, как она предположила. Далее система учитывает, верно ли она сделала вывод, — и переходит к новому фото. Сегодня сотни тысяч изображений предварительно вручную обрабатываются людьми — обычно с привлечением краудсорсинга. Поэтому масштабировать такой процесс сложно: нужно будет все больше людей и все больше времени. Это сдерживающий фактор для многих областей потенциального применения компьютерного зрения. Есть два пути его преодоления. Во-первых, нужно активнее развивать методы машинного обучения без учителя. Тогда системы научатся принимать решения полностью самостоятельно. Тогда мы сможем все увеличивать объем обрабатываемых изображений, фактически он будет безлимитным. Во-вторых, можно работать с метаданными фотографий и видео. Мы пошли во многом по второму пути и смогли перейти на обучение с частичным привлечением учителя. В этом случае мы даем добровольцам размечать только ограниченный набор изображений (в нашем примере- около 2000) и впоследствии уже автоматически соотносим отдельные объекты. Постепенно, за счет эффективных алгоритмов, система учится все лучше и лучше устанавливать связи между объектами, изначально названными людьми, и образами. В целом, все еще остается «вызовом» развитие все более качественных алгоритмов для глубинного обучения и их все более «результативных тренировок», это все еще «открытая территория».
К тому же, многое предстоит сделать в разработке систем для распознавания трехмерных объектов. Сегодня большинство исследователей сосредоточены на распознавании визуальных образов в работе с фотографиями, на повышении детализации. Но многие забывают, что мы воспринимаем мир объемно, поэтому нам нужно учить машины не сводить картинки, а «видеть» объемно.
— Технологии компьютерного зрения выходят из стен академических институтов на рынок, компании от Microsoft до Facebook открывают подразделения для работы с ними. Как научное сообщество работает с бизнесом?
— Могу сказать, что с машинным зрением активно работают не только интернет-корпорации, которые хотят улучшить в том числе качество поиска по изображениям, но и игроки в сфере hardware – например, Intel и Qualcomm. Но все компании все еще не могут проводить полностью самостоятельные исследования, большинство значимых научных результатов выходят из академической среды. У меня встречи с представителями тех или иных компаний примерно раз в неделю — кто-то спрашивает о сотрудниках для своих подразделений, кто-то хочет заказать разработки. Мы часто отправляем в лаборатории корпораций студентов и аспирантов, а вот браться за многие задания я не могу — не хватает ресурсов сотрудников, хотя я продолжаю давать консультации. Уверен, корпорации могут использовать наши наработки, финансировать новые исследования, привлекать кадры. Я не рисую радужной картинки, это искренняя оценка: взаимодействие науки и бизнеса очень «здоровое».
Кстати, к нам обращаются и стартапы. Работа моей небольшой команды (около 20 человек) уже дала жизнь четырем стартапам. Интересно то, что они не просто взяли наши готовые разработки для коммерциализации, а использовали наши глубокие базовые знания технологий компьютерного зрения, объединившись со студентами, и запустили проекты с собственными идеями. Например, одна из наших разработок для археологии стала основой для рыночного продукта. Это очень вдохновляет. Я думаю, что и дальше стартапы, инвесторы и ученые будут работать совместно. На мой взгляд, хотя венчурный капитал сосредоточен в Кремниевой Долине, перспективные стартапы будут появляться и в Европе — по крайней мере, во Франции я вижу для начинающих компаний в этой сфере много возможностей работы с инкубаторами, с частными инвесторами. Но все же они будут продолжать работать с академическими институтами — именно здесь сосредоточены люди, глубоко понимающие технологии.
— В каких сферах технологии машинного зрения сегодня применяются наиболее эффективно? Где вы видите перспективы наиболее серьезных прорывов с точки зрения внедрений?
— Я ученый и, пожалуй, не смогу прогнозировать скорость внедрения этих технологий в тех или иных отраслях. Я могу отметить, что, безусловно, мы живем в век умных машин и если мы хотим, чтобы они все активнее входили в жизнь, мы должны научить их восприятию. Одной из серьезнейших задач, безусловно, будет интегрировать компьютерное зрение в автономные роботизированные системы для «дикой среды». Я имею в виду, что пока мы тренируем системы компьютерного зрения, например, для промышленных роботов — мы можем учить их в условиях, которые при моделировании максимально приближаем к тем, что они встретят, скажем, на той или иной фабрике. Создать же «тренировочный полигон» для систем компьютерного зрения для будущих роботов на улице будет намного сложнее. Открытые пространства для машин означают очень широкий набор меняющихся параметров — разная погода, разные показатели видимости, разные шумы, разные городские ландшафты. Нам еще предстоит разработать системы, способные подстраиваться одновременнно под самую разную обстановку.
Современные офтальмологические приборы
Когда начинает падать зрение, самый главный вопрос, на который нужно ответить — почему это происходит? Какая технология сохранения зрения будет наиболее эффективна? Ведь только установив причину недуга, можно выбрать правильную методику коррекции зрения.
Глазной тонограф
Одной из основных причин слепоты является глаукома. Это заболевание связано с повышением внутриглазного давления и развитием атрофии зрительного нерва. Очень важно вовремя обнаружить изменения. Для этого проводится электронная тонография.
Что это и как оно работает?
Тонограф — это прибор, позволяющий фиксировать величину внутриглазного давления и устанавливать скорость оттока камерной влаги. Датчик опускают на роговицу глаза на пять секунд. Затем прибор убирают на полминуты и возвращают на роговицу глаза уже на четыре минуты. На финальном этапе проводят три пятисекундных измерения. Все показатели фиксируются и передаются на компьютер для обработки.
Оптический томограф
Прорывом в диагностической офтальмологии можно назвать оптическую когерентную томографию. Это исследование позволяет выстроить высококачественное изображение поверхностных и глубинных элементов глаза и продемонстрировать виртуальное зрение, которое имитирует эффекты индуцированного изменения после лечения.
Этот метод безопасен и более точен, чем широко известные МРТ и КТ.
Какие функции выполняет оптический томограф?
Оптический томограф пропускает через глаз световые волны. Время их прохождения, задержки, интенсивность отражения фиксируется, затем полученные данные анализируются и переносятся на монитор в виде готового изображения. Эта методика совершенно безболезненна и безопасна, так как ничего не нужно вводить внутрь глаза.
Процедура длится несколько секунд, а результаты будут известны в течение часа. Это позволяет немедленно начать лечение, чтобы как можно раньше устранить дефект зрения.
Компьютерный анализатор поля зрения
Большое место в эффективности лечения основных причин слепоты занимает ранняя диагностика. Компьютерный анализатор — еще один инновационный прибор, который позволяет на начальной стадии выявить глаукому, дистрофию и отслоение сетчатки, воспаление зрительного нерва и опухоли глазного яблока.
Что он анализирует?
Аппарат определяет границы поля зрения и световую чувствительность днем, в сумерках и ночью. Исследование абсолютно безопасно и безболезненно. Врачи рекомендуют проходить его раз в год всем, особенно пациентам старше 40 лет.
Современные технологии для слабовидящих людей
Хотя бы частично вернуть зрение — мечта незрячего человека. Сегодня некоторые современные технологии возвращают зрение, дарят возможность увидеть свет, контуры людей и предметов или начать самостоятельно ориентироваться в пространстве.
Все о технологии Al Glasses
Пусть искусственный интеллект и не поможет незрячему человеку увидеть окружающий мир, но он может рассказать о нем. Мексиканские ученые разработали умные очки Al Glasses, способные распознавать препятствия и прокладывать безопасный маршрут.
История
В 2014 году институт Cinvestav (Мехико) анонсировал разработку уникального девайса. А уже в 2015 стартовало производство высокоинтеллектуального устройства для невидящих людей.
Как это работает?
Очки Al Glasses оборудованы камерами и ультразвуковым сканером, которые передают данные об окружающей среде в «искусственный мозг». Он обрабатывает полученные сведения и транслирует их пользователю. Такие очки «видят» номера зданий, вывески, различают даже прозрачные предметы, оценивают расстояние до препятствий и т.п.
Assisted Vision Smart Glasses
Другие умные очки разработали в Великобритании. Assisted Vision Smart Glasses усиливают зрение людей, у которых сохранилась частичная способность видеть.
История
В 2013 году оксфордский ученый Стивен Хикс выступил с презентацией прорывного научно-клинического проекта. Он представил очки, способные отчасти вернуть зрение слабовидящим людям. Точнее, улучшить его: усилить восприятие света, различить контуры людей и окружающих объектов.
Как это работает?
В оправу очков встроены микроскопические видеокамеры, а вместо линз вставлены светодиодные сетки. Камеры снимают окружающие предметы и передают данные в процессор, а оттуда обработанное изображение транслируется на дисплеи.
Контактные линзы будущего
Что уже изобрели?
Настоящим прорывом стало изобретение бионического глаза — устройства для коррекции зрения, будто воплотившегося из фантастического фильма. Эта линза вживляется внутрь глаза и способна исправить любой дефект зрения, не связанный с повреждением сетчатки. Благодаря созданию бионического глаза незрячие люди получат возможность различать свет, видеть силуэты предметов.
Что еще изобретут?
Самый главный вопрос — что нас ждет дальше, какая технология сохранения зрения будет представлена в ближайшее время? Не исключено, что после бионического глаза создадут и другие приспособления для восстановления зрения. Например, искусственную роговицу глаза со встроенными функциями. И все мы ждем успешного научно-клинического проекта, который поможет на 100% вернуть зрение людям, полностью утратившим способность видеть.
Многие из нас, когда слышат о современных технологиях – искусственном интеллекте, роботах, машинном зрении или интернете вещей, – сразу представляют фильм «Робокоп» или «Матрица». Некие опасения, конечно, присутствуют, но объективная польза от технологий и будущий прогресс, которые они могут дать, перевешивают доводы из теории восстания машин. В частности, появившаяся в 1960-х гг. область компьютерного зрения значительно продвинулась вперед благодаря росту производительности вычислительной техники. По прогнозам MarketsandMarkets, этот рынок вырастет с почти $16 млрд в 2021 г. до более чем $50 млрд к 2026 г.
Основные задачи компьютерного зрения включают в себя распознавание объектов, оценки позы и движения, визуальное отслеживание и т. д. Сегодня эта технология активно используется в промышленности и на производстве, но можно представить несколько сценариев ее применения в городе.
Комфортная среда для людей с ограниченными возможностями
В метрополитене и на вокзалах созданы службы, куда маломобильные люди могут отправить заявку с просьбой оказать помощь в перемещении в транспорте. Но обычно это надо делать заранее. На подходах к транспортным узлам можно поставить камеры. Они будут распознавать посетителей, передвигающихся на колясках, и передавать оповещение соответствующим сотрудникам, чтобы те оказали оперативную помощь. Тогда можно будет совершать поездки в любое удобное время.
Также нейросеть можно обучить распознавать людей с ограничениями по зрению, заложив туда паттерн их поведения. Система может хранить всю аналитику по работе с такой категорией граждан: оказанной или не оказанной им помощи, времени, событию, местоположению, частоте использования, возникающим проблемам. Внедрение такого сценария на транспорте поможет повысить комфорт и качество городской среды для людей с ограниченными возможностями. Можно применить этот сценарий в ритейле, сфере питания, развлекательных комплексах, кинотеатрах, что повысило бы доступность социальных и развлекательных услуг для маломобильных людей. Социальная составляющая бизнеса приобретает все большее значение, и, если владельцы ресторанов или магазинов запустят такой сервис, это скажется на лояльности покупателей в целом.
Камеры можно установить на инвалидные кресла слабовидящих, ведь слепые люди не всегда передвигаются пешком. Проводились исследования, где с помощью разработанных алгоритмов компьютерного зрения определялись важные особенности местности (бордюры, обрывы и т. д.), которые в режиме реального времени обрабатывались камерами, прикрепленными к инвалидному креслу. Затем информация передавалась путешественнику в виде синтезированной речи, звуковых сигналов или тактильной обратной связи, чтобы он мог использовать эти данные для самостоятельного управления креслом-коляской.
Пассажиропотоки и транспорт
В период пандемии стало популярным использование видеонаблюдения, технологий искусственного интеллекта и компьютерного зрения для создания социальной дистанции между людьми. Например, американский интернет-ритейлер Amazon начал тестировать сервис, который позволяет следить за соблюдением социальной дистанции на складах компании. Мониторы выделяли сотрудников, подошедших слишком близко к коллегам. В городских условиях подобная технология может помочь создавать тепловые карты в местах скопления людей, в том числе во время массовых мероприятий, что поможет разграничить потоки, избежать толкучки, давки, несчастных случаев. Болельщики мюнхенской «Баварии», например, собираясь на «Альянц арену», с помощью мобильного приложения получают информацию о дорожной ситуации и оптимальных маршрутах, чтобы без пробок попасть на стадион. Все это делается с помощью smart-системы, где собираются данные.
Технология распознавания лиц и компьютерного зрения поможет и в общественном транспорте: в мониторинге пассажиров, не оплачивающих проезд, в отслеживании целевого использования социальных карт, в контроле за сотрудниками, проверяющими оплату проезда, за состоянием водителей. Например, в Азербайджане разработали решение по мониторингу безопасных условий пассажирских перевозок на междугородных рейсах. Технологии машинного зрения и машинного обучения позволяют в режиме реального времени получать информацию о пассажиропотоке и усталости водителей, с помощью интернета вещей можно отслеживать техническое состояние и условия в салоне транспортного средства, а также биометрические показатели водителя. Например, в Литве был реализован пилот на 10 пригородных поездах, когда программное обеспечение на основе компьютерного зрения использовало информацию с камер видеонаблюдения для измерения пассажиропотока в транспорте. Велся подсчет людей, входящих и выходящих из поезда на каждой остановке, граждан с детьми, животными, а также пассажиров, перевозящих велосипеды. Если дополнить информацию о потоках пассажиров в режиме реального времени данными о продажах билетов, можно сократить количество безбилетников. Считать пассажиров планировали и московские власти.
Эмоции как сервис
Использование технологии распознавания лиц вызывает много споров, поскольку тесно связано с массовым сбором персональных данных. Но ее применение набирает обороты. Причем не только для выявления преступников или нарушителей, но и для прохода в метро, и для оплаты в банкоматах. Также компании начинают использовать систему для распознавания эмоций своих клиентов. Например, о тестировании соответствующей технологии сообщала сеть кофеен, которая с ее помощью собиралась определять новых и постоянных клиентов, анализировать посещаемость по дням и часам, определять возраст, пол и эмоции.
В свою очередь, объединение фитнес-клубов запустило систему распознавания лиц для борьбы с мошенничеством и для сокращения затрат на администраторов. Клиентов теперь встречает и узнает нейросеть. Несмотря на разные правовые нюансы, эту технологию можно было бы использовать для повышения лояльности клиентов и определения сотрудников, которые делают посетителей «счастливыми». Например, в банках или МФЦ – часто посещаемых в городе местах – есть устройства с разными смайликами для оценки обслуживания. Их может заменить система распознавания эмоций, которая определяла бы, насколько доволен клиент обслуживанием. Кстати, эта технология применима и для оценки уровня «счастья» и удовлетворенности посетителей онлайн-мероприятий: конференций, воркшопов, онлайн-уроков, мастер-классов и т. д.
Рынок компьютерного зрения растет огромными темпами. При этом увеличивается не только количество внедряемых систем, но и направления их использования. Системы компьютерного зрения (Computer Vision – CV) позволяют распознавать и анализировать изображения, полученные с помощью фото- или видеокамер. Электронное око заметит малейшую техническую неисправность и даст сигнал тревоги. Фото: Photoxpress
Для этого используется специальное программное обеспечение. В прошлом году Институт статистических исследований и экономики знаний НИУ ВШЭ включил CV в список 15 наиболее значимых цифровых технологий в мировой и российской промышленности.
читайте также–> –> Ученые создают помощников с искусственным интеллектом
Мировой рынок таких систем оценивается в 14 миллиардов долларов, и, по прогнозам, за два года он должен как минимум удвоиться, сообщил “РГ” руководитель направления “Робототехника и искусственный интеллект” Кластера информационных технологий Фонда “Сколково” Павел Кривозубов. “Система машинного зрения – это, пожалуй, одна из самых часто применяемых в мире технологий из всех областей искусственного интеллекта”, – пояснил он.
Спрос на подобные системы быстро растет и в нашей стране. Если в 2019 году объем российского рынка компьютерного зрения оценивался в 8 миллиардов рублей, то к концу 2023 года он может достигнуть 38 миллиардов. Согласно опросу TAdviser, самыми перспективными отраслями для CV считаются видеонаблюдение и безопасность – их назвали 28 процентов респондентов. Столько же у медицины и здравоохранения. Далее следуют транспорт и производственный сектор – по 16 процентов. На видеоаналитику самый большой спрос (17 процентов заявок) у туристического сектора, сферы культуры и досуга. В лидерах также промышленность, строительство и коммерческая недвижимость (11-15 процентов), рассказал директор по продуктам компании NtechLab Денис Гришин.
“При этом меняются потребности и государства, и бизнеса. Например, компании отходят от идей контроля и безопасности и больше фокусируются на обслуживании клиентов. А государство стремится развивать “умные города”, – отметил он. – Например, 25 процентов от общего количества запросов касается распознавания силуэтов для подсчета нагрузки культурных, социальных, спортивных и транспортных объектов”.
Технологии компьютерного зрения сейчас не игрушка: они решают самые серьезные задачи
Одно из наиболее популярных направлений у бизнеса, по данным NtechLab, – терминалы самообслуживания (рост запросов на 580 процентов в 2021 году). Ими интересуются транспорт, рестораны, гостиницы, банки и особенно розничная торговля, которой требуется возможность оплаты товаров по лицу и приобретения табачной и алкогольной продукции без предъявления документов, если покупатель ранее подтвердил свои данные.
Использование систем компьютерного зрения на транспорте ведет к тому, что он в итоге сможет обходиться без водителей. К примеру, уже в этом году в некоторых городах России заработают беспилотные такси. В скором времени работающая без человека техника может появиться и на полях. В октябре 2021 года Петербургский тракторный завод и разработчик систем искусственного интеллекта для сельхозтехники компания Cognitive Pilot договорились о начале производства пробных промышленных партий беспилотной версии трактора “Кировец” К-7М. По предварительным расчетам, система автопилотирования позволит увеличить производительность техники на 15-20 процентов и сэкономить на ремонте 70-80 процентов.
38 миллиардов рублей может составить российский рынок компьютерного зрения в 2023 году
Одна из главных тенденций на российском рынке компьютерных систем – внедрение их в промышленность для контроля и автоматизации технологических процессов, сообщил доцент кафедры автоматики и процессов управления СПбГЭТУ “ЛЭТИ” Дмитрий Каплун. Компьютерное зрение, по его словам, позволяет ускорять производственный процесс, снижать затраты на персонал и оборудование, а также влияние человеческого фактора.
В прошлом году Объединенная двигателестроительная корпорация, входящая в состав Госкорпорации “Ростех”, начала внедрять технологию компьютерного зрения на своем производстве. С ее помощью контролируется качество лопаток турбины нового авиадвигателя ПД-8. В компании отмечают, что цифровые технологии позволят существенно сократить время производства двигателя.
читайте также–> –> У искусственного интеллекта обнаружили новое неожиданное свойство
Другие сферы применения систем компьютерного зрения – пищевая, тяжелая промышленности, фармацевтика, электроника, перечислил технический директор компании “Системы компьютерного зрения” (входит в группу ЛАНИТ) Михаил Смирнов. “Мы разрабатываем такие решения для автомобильной и лесной промышленности, для строительства, – отметил он. – Один из проектов – система распознавания складских запасов любых типов, использующая компьютерное зрение и искусственный интеллект. С ее помощью можно измерить параметры штабелей леса, коробок с продукцией, расположенных в кузове грузовика. Первые запуски платформы показали, что она работает с точностью до 97 процентов”.
Сейчас технологии компьютерного зрения решают самые серьезные задачи, отметил ведущий научный сотрудник Лаборатории алгоритмов и технологий анализа сетевых структур НИУ ВШЭ Андрей Савченко. “Это касается и промышленного производства, и других сфер. Я работал, например, с системами, которые анализировали изображения газопроводов и следили, чтобы не было повреждений в сейсмически опасных местах. Или с системами, следящими за животными на фермах, – отметил он. – Если говорить о перспективах, думаю, что эти технологии будут все активнее использоваться в мобильных устройствах. Будет развиваться анализ эмоций людей, например при просмотре рекламы, и многое другое”.
Anna Medvedeva 27 октября 2021 в 08:10 эксклюзивУдаленная агрономия – это не фантастика, а реальность, считает эксперт
Равив Ицхаки, соучредитель и технический директор Prospera Technologies, который возглавляет техническое видение компании по преобразованию способов выращивания продуктов питания с помощью науки о данных и искусственного интеллекта (имеет степень бакалавра физики и магистра прикладной физики Еврейского университета) опубликовал статью о технологических тенденциях в АПК на портале www.precisionag.com.
«Компьютерное зрение переживает настоящий бум. Информация, полученная с помощью дронов, спутников и самолетов, собирает данные с неба. Установленные на оборудование датчики могут измерять изменения характеристик растений или параметров почвы с помощью оптического измерения коэффициента отражения. Датчики LiDAR теперь способны измерять структуру растений в 3D.
Помимо помощи агрономам с данными, компьютерное зрение также лежит в основе создания автономных машин в поле, помогая технике реагировать на ситуации в поле или даже обнаруживать препятствия. Технологии также позволяют нам реагировать на сверхточные данные о местоположении со спутниковых снимков, что дает детализацию сантиметрового уровня. Имея в своем распоряжении все эти технологии, нужно ли нам вообще простое человеческое зрение?
Как только эти камеры, датчики и спутники будут развернуты на полях и в теплицах, они обеспечат 100% круглосуточное наблюдение.
Когда это произойдет, удаленная агрономия и в значительной степени удаленное сельское хозяйство станут реальностью.
Поскольку автономные машины и роботы берут на себя все большее количество ролей, они, тем самым, избавляют людей от самого утомительного и монотонного труда. Хотя сегодня большинство фруктов и овощей все еще собирают и упаковывают вручную, в отчете S&P Global прогнозируется, что к 2025 году системы восприятия и алгоритмы сбора позволят внедрить автономный сбор урожая в теплицах. Процесс сортировки также автоматизируется, поскольку эта задача при выполнении людьми требует много времени, вариативна и дорога.
Визуальные технологии уже стимулируют развитие АПК способами, кардинально меняющими подход к производству сельхозпродукции.
Визуальные датчики и компьютерное зрение будут иметь решающее значение, чтобы помочь всей отрасли удовлетворить потребности растущего населения мира в продуктах питания.
Данные Всемирного банка показывают, что к 2025 году на большинство секторов продовольствия и сельского хозяйства окажет серьезное влияние внедрение визуальных технологий, таких как распознавание изображений, камеры, робототехника и многое другое. Неудивительно, что компьютерное зрение и технологии искусственного интеллекта находятся в центре новой волны многообещающих технологических стартапов во многих сферах, включая розничную торговлю, строительство, страхование, безопасность и сельское хозяйство.
Производителям продуктов питания доступно множество визуальных технологий. Это включает в себя любое устройство или инструмент, который собирает, анализирует, фильтрует, отображает или распределяет визуальные данные. Эти системы предназначены для использования компьютерного зрения, машинного обучения или искусственного интеллекта, чтобы анализировать все визуальные данные и предоставлять либо действенные идеи, либо автономно действовать в соответствии с ними.
В недавнем отчете LDV Capital о визуальных технологиях подчеркиваются некоторые ключевые тенденции будущего, связанные с внедрением визуальных технологий в АПК на следующую пятилетку.
Самое интересное то, что акцент сделан на улучшение и внедрение существующих технологий.
Это будет не революция, а прогрессивная эволюция по мере того, как визуальные технологии станут мейнстримом. Например, в отчете указывается на алгоритмы машинного обучения, которые принимают снимки с дронов, самолетов и спутников с повышенным разрешением и более широким спектральным диапазоном, что еще больше делает возможным удаленную агрономию. Кроме того, по мере увеличения скорости обработки установленные на оборудовании датчики позволят принимать решения на уровне растения, такие как точное опрыскивание сорняков и заделка семян.
С таким количеством «глаз», контролирующих и оценивающих растения 24/7, и визуальными технологиями для целых полей и теплиц, удаленная агрономия не выглядит фантастикой.
По опыту работы с нашими клиентами я знаю, что многим производителям продуктов питания уже нужно гораздо реже выезжать на поля благодаря идеям или изображениям, сделанными машинами и доставленными им. Более того, способность машин в защите растений превосходна – вместо обычных выборочных агрономических проверок эти устройства могут контролировать 100% посевов в 100% случаев.
Хотя компьютерное зрение – крупный прорыв, который изменит способ выращивания и обработки продуктов питания, это еще не все. Необходимы другие дополнительные технологии, которые позволят нам видеть под листьями и под землей, что не менее важно для получения полной картины. Например, мониторинг и анализ микробиома с помощью специальных датчиков, которые измеряют численность, разнообразие и колонизацию микроорганизмов в надземных и подземных органах растений.
Сбор, интеграция и осмысление всех этих данных – ключевая задача для использования растущей технологической мощи АПК. Конечная цель – создать единую систему, которая дает полную и четкую картину, необходимую для принятия более эффективных агрономических решений на высоком уровне».
(Источник: www.precisionag.com. Автор: Равив Ицхаки. Фото: pixabay.com).
Интересна тема? Подпишитесь на персональные новости в Я.ДЗЕН | Pulse.Mail.ru | Я.Новости | Google.Новости.