Юрий Аммосов О компании A4Vision я впервые услышал летом 2002 года от знакомого, который рассказал мне, что работает в компьютерной фирме, занимающейся распознаванием трехмерных образов. Распознавание, как и трехмерность, - направления, к которым в России с давних пор питали особую слабость; большая часть успехов наших компьютерных фирм связана либо с первым, либо со вторым, а часто и с тем и с другим сразу. Abbyy, Parallel Graphics, Cognitive, Real-Time Geometry, Neurok - примеров много, вплоть до антивирусных программ, использующих ту же алгоритмическую базу, что и 3D-технологии. "Не ново", - подумал я. Но следующая фраза заставила насторожиться: мой собеседник упомянул, что у компании есть зарубежные инвесторы, вложившие в нее несколько миллионов. Это резко изменило картину: до сих пор единственными компаниями отечественного происхождения в 3D-поле, которые смогли привлечь инвестиции такого масштаба, были ирландская Parallel Graphics и американская RTG. Голая технология История A4Vision начиналась еще в 1998 году (ее название расшифровывается как Application for Vision, "приложения для зрения"). Двое ее основателей, недавние выпускники МГТУ им. Баумана Артем Юхин и Андрей Климов, разработали устройство, названное в патенте "бесконтактный оптический трехмерный сканер" - прибор для, грубо говоря, трехмерной фотографии. Устройство изначально создавалось для "машинного зрения" - например, для автономных роботов, передвигающихся по местности со сложным рельефом. Шел 2000 год, интернет-бум был в разгаре, и, как многие другие молодые разработчики в ту пору, авторы идеи стали искать инвестора. Однако инвестор нашел их сам. Незадолго до этого в Европе был образован венчурный фонд-инкубатор myQube (создатели - промышленные группы Benetton и Pirelli, международный инвестиционный банк Merrill Lynch и др.). Свою задачу myQube видел в капитализации на электронной коммерции, Интернете и прочих модных идеях. Попутно было решено включить в портфель фонда компанию, занимающуюся 3D. myQube вышел на A4Vision самостоятельно. После длившихся более полугода переговоров (конкурентами фонда были еще три корпоративных инвестора) основатели A4Vision решили инвестироваться именно через myQube, не в последней степени из-за хороших отношений, сложившихся с партнерами фонда. Первые инвестиции, около миллиона долларов, в A4Vision поступили под новый, 2001 год. В активе A4Vision изначально не было никаких коммерческих продуктов - одна голая технология. Что можно сделать на продажу, еще предстояло придумать совместно с опытными венчуристами. Сначала на базе технологии A4Vision планировалось создавать трехмерные изображения товаров для электронных магазинов, что было явно неразумной и, к счастью, недолго просуществовавшей идеей (именно на этом погорела компания Boo.com, чьи взлет и стремительное падение стали первым свидетельством кризиса в Европе). Затем компания стала работать над софтом для пластических хирургов, моделирующим внешность клиентов после косметической операции. Может быть, эта затея и увенчалась бы успехом, но тут грянуло 11 сентября, и бешеным спросом стали пользоваться технологии безопасности. Чем заниматься компании, сразу стало понятно: косметические наработки легко поддавались конвертации в антитеррористические средства распознавания внешности, тем более что Артем Юхин уже занимался проблемой - это была тема его дипломной работы. Метод Герасимова наоборот Технологии безопасности, как они понимаются сейчас, включают в себя все - от защиты компьютеров от взлома до средств обнаружения бактериологического загрязнения. Внутри этого класса есть множество семейств и подсемейств. A4Vision работает на рынке систем биометрии - методов установления личности человека. За века таких способов накопилось немало. Первой профессиональной методикой была известная система Бертильона. Бертильонаж заключался в классификации формальных антропометрических признаков, таких как рост, вес, форма черепа, длина носа. В дальнейшем техника описания внешности усложнялась: была открыта индивидуальность формы человеческого уха и отпечатков пальцев, появился известный "метод Герасимова". Антрополог М. М. Герасимов обнаружил статистическую зависимость между толщиной мышц лица и строением черепа. Измерив расположения нескольких десятков характерных точек черепа и углы лицевых костей, по формулам Герасимова можно восстановить внешность человека. Автоматическое сравнение параметров индивида с имеющимися в базе данных имеет свои особенности. По словам Артема Юхина, сейчас существуют три основных метода автоматического опознания человека: по отпечаткам пальцев (дактилоскопия), по радужной оболочке глаза (иридодиагностика) и по лицу в целом, чем и занимается A4Vision. Этим методы распознавания не исчерпываются: есть и более экзотические способы. Например, не так давно исследователи Fujitsu-Siemens продемонстрировали способ идентифицировать человека по рисунку вен ладони, который, как считается, также индивидуален и не изменяется с возрастом. Однако основными способами все еще остаются "пальцы" и "глаза". Иногда, говорит Юхин, "пальцы" отказывают: так, у представителей восточноазиатских народов отпечатки пальцев выражены намного хуже, чем у европейцев, и для идентификации не годятся. Как рассказал "Эксперту" вице-президент A4Vision Алексей Гостомельский, используемые прямыми конкурентами фирмы методы опознания человека по лицу опираются на двухмерные образы, например фото. Единственный метод, доступный для анализа фотографии, - это распределение яркости на частях лица. Главной проблемой при таком распознавании является масштаб: картинки разных размеров сравнивать тем сложнее, чем менее сопоставимы их масштабы. Для подгонки тестовой картинки под контрольную обычно измеряется межглазное расстояние, и по нему, как по мерке, сопоставляются пропорции двух лиц. Однако небольшой поворот головы сводит эти ухищрения на нет: двухмерное масштабирование сбивается, и все пропорции оказываются искажены. Освещение и так называемые маскирующие факторы (очки, гримасы и прочее) также могут стать непреодолимой проблемой. Технология A4Vision состоит в снятии поверхности лица методом структурированной подсветки. По полученным данным строят трехмерную модель внешности в миллиметрах. Затем компьютерный алгоритм создает модель твердых тканей головы - то есть, по сути, "сдирает" с лица мягкие ткани, обнажая череп. Это, так сказать, метод Герасимова наоборот. После этого модель черепа вписывается в модель мягких тканей. Образец для сравнения готов. Основными показателями, на которые обращает внимание механизм распознавания, является не сравнительное положение точек черепа и тканей лица, а кривизна поверхностей и зон. Как поменять лицевой угол и вырез скул, чтоб обмануть такой способ идентификации, пока не придумано. Непреодолимым препятствием к распознаванию могут стать все те же очки; но, поскольку они представляют собой плоскость, находящуюся на расстоянии от лица, программа может заметить характерный выступ перед глазами и даже попросить через компьютерный динамик снять очки. Или просто вычеркнуть часть лица из схемы опознавания и просчитать то, что очки не прикрывают. Основная технологическая задача, стоящая сейчас перед A4Vision, - добиться существенно лучшего качества распознавания по сравнению с конкурентами. Только тогда дискредитированная более ранними "двухмерными" попытками технология может заинтересовать заказчиков. В пользу технологии A4Vision сейчас то, что система распознает лица очень быстро - по утверждению представителей компании, "в реальном времени", то есть со скоростью видеосъемки, 10-25 образов в секунду, чего конкурирующие сканирующие системы делать пока не могут. Отечественная компьютерно-математическая школа здесь на высоте. Но зато для введения в систему модели лица необходимо, чтобы человек предстал перед специальной камерой. Составить базу правонарушителей, таким образом, можно, только приведя их в участок под белы руки: для уголовников это, может, и сойдет, а вот террористов, известных часто только по плохим и смазанным фото, так в базу данных не введешь. Дистанционное опознание технология также пока осуществлять не позволяет: камера работает на расстоянии только до полутора метров, но, как сказали мне в A4Vision, сейчас идет работа над камерой, способной "захватывать" лица на расстоянии до десяти метров, после чего уже можно будет претендовать и на сканирование толпы. A4Vision в нынешнем состоянии вряд ли сможет ловить образы в толпе на бегу. По мнению "Эксперта", алгоритмы распознавания в будущем могут нуждаться и в более тонкой настройке: когда речь идет о нескольких сотнях человек, система A4Vision справляется с задачей превосходно, но это еще не значит, что она будет так же успешно распознавать лица в базе из нескольких десятков тысяч. Массовый тест системе еще предстоит пройти. Для своего нынешнего уровня она выполняет задачи очень неплохо. Обозреватель "Эксперта" проверил систему на собственном лице: постояв секунд сорок перед сканером (похожем на планшет размера А3 из черного стекла), я увидел на компьютере окончательный мастер-рисунок. Надо сказать, что сам я себя бы не узнал: безглазая компьютерная голова на экране казалась то ли гипсовой маской, то ли вылепленной из теста и к тому же не имела верхней части черепа. Голову записали в базу данных как "Юрия Аммосова", после чего сканер сбросили и включили на повторное контрольное распознавание. Компьютер заявил, что с вероятностью 95% перед ним "Юрий Аммосов". Я попробовал погримасничать, надуть щеки. Система чуть-чуть убавила точность, физиономия на экране потеряла часть внешности (будто в ней пробили дырку молотком), но сойти за другого мне не удалось. Что ж, для организаций с небольшим числом сотрудников такая точность может оказаться приемлемой. Первые деньги Пойдет ли эта система на рынке, еще неясно, но пока спрашивать об этом A4Vision преждевременно: продажи продуктов на базе технологии распознавания только начинаются. A4Vision не продает свои разработки напрямую конечным потребителям, работая через специализированных интеграторов. Основным продуктом, который компания предлагает на базе этой технологии, является так называемый Software Developer Kit (SDK) - так на компьютерном жаргоне называется набор лицензионных программных модулей, которые поставщики конечных решений могут встраивать в другие программы. Сейчас у A4Vision три клиента-интегратора в Европе и один - в США. Помимо этого, крупным клиентом A4Vision является швейцарская компания Logitech, известный производитель компьютерной периферии (оптических мышек, беспроводных клавиатур и проч.). Для Logitech A4Vision разработала специальную камеру, которая автоматически фокусируется на лице сидящего перед ней человека, следуя за движениями головы. Такие умные камеры предполагается применять прежде всего в программах коммерческой видеоконференцсвязи. В феврале 2003 года Logitech объявила о том, что лицензировала эту технологию и запускает ее в производство, а A4Vision выручила за свою продукцию первые деньги. Юридически A4Vision является американской компанией, однако в США работает только 6 человек из 59. Это два руководителя - CEO и CFO, два сейлза и два инженера-наладчика. Все. Большинство сотрудников работает в дочерней лаборатории A4Vision в столичном Замоскворечье (в "промежутке" между США и Россией есть еще дочерняя швейцарская компания с пятью работниками, и такая схема - дань преимущественно итало-швейцарскому составу инвесторов). В Москве у A4Vision занято 48 человек. В основном это инженеры и программисты: 17 человек заняты разработкой программного обеспечения, 8 человек работают в отделе контроля за качеством и запуска, 9 занимаются разработкой оборудования. Число руководителей в компании невелико: московский офис возглавляют три вице-президента. Основатели компании сейчас занимают инженерные должности, деловыми вопросами - финансами, маркетингом, развитием - заведуют другие люди, приглашенные со стороны. В среднем расходы компании составляют около 250 тыс. долларов в месяц. Основная часть этой суммы приходится на R&D. Продажи и маркетинг берут около 20% бюджета. Остальное (примерно 12%) - разнообразные административные расходы. Как уже говорилось, компания только начинает осуществлять первые сделки. За два-три года A4Vision планирует выйти на объем продаж до 10 млн долларов и более и достичь точки текущей безубыточности. Общий объем инвестиций, вложенных mуQube и его партнерами по инвестиционному синдикату - Logitech и частными инвесторами, - составил 6,5 млн долларов. Синдикату сейчас принадлежит около 85% акций компании, из них 40% - myQube. Есть у компании и опционная схема, правда, не у всех сотрудников, как положено по калифорнийскому принципу, а только у руководителей. Впрочем, и опционы у нас в стране пока никого не обогатили в отличие от Калифорнии. С венчуристом "на борде" Пример A4Vision интересней всего тем, что на нем очень четко видно, зачем технологической компании венчурный фонд. MyQube сделал с A4Vision практически все то, что может сделать с компанией венчурный капиталист: трижды поменял по ходу дела стратегию развития, сместил основателей с руководящих должностей на инженерные и изрядно размыл их доли - пожалуй, даже намного больше, чем обычно "размывают" основателей на первых раундах в Калифорнии. Однако все эти приключения, на наш взгляд, стоили того, поскольку именно присутствие в деятельности компании myQube вывело ее на те рубежи, где она находится сейчас. Для вхождения в современный технологический бизнес необходимы деньги и связи. Добыть нужные деньги российскому разработчику технологий очень трудно, нужные связи - почти невозможно. Важность венчурных денег состоит в том, что они финансируют компанию на допродажной фазе, которая может быть продолжительной. Мгновенная окупаемость в технологическом бизнесе просто невозможна. Для того чтобы распознавание лица стало пригодным к демонстрации, над ним в течение полутора лет должны были работать несколько десятков человек, и даже сейчас A4Vision планирует выйти на самоокупаемость только через год-два. В сумме это примерно четыре года работы без прибыли и два - без продаж. Не имей Юхин и Климов многомиллионного бюджета, показывать покупателям было бы нечего: самостоятельно до фазы продукта они бы не довели свою технологию никогда. Но даже если б A4Vision и смогла разжиться где-то несколькими миллионами длинных денег, еще не очевидно, что это сильно бы ей помогло. Сейчас контакты молодой компании выглядят очень убедительно: созданная совсем недавно технология была лицензирована Logitech и поставляется четырем крупным западным интеграторам. Однако сами руководители компании смогли наладить контакт только с одним из интеграторов (через одну из деловых выставок). Все остальные контакты компании обеспечили ее инвесторы. Logitech инвестировала с подачи партнера myQube Джан Лука Браджотти, все европейские интеграторы были приведены усилиями Браджотти и другого партнера myQube - Пьеро Аббате. Словом, практически все партнеры компании не появились бы без участия венчурных капиталистов. Участие венчурных капиталистов также активно сказалось и на кадровом усилении компании. С начала этого года у A4Vision новый руководитель: пост CEO занял Грант Эванс, бывший вице-президент по маркетингу и продажам компании Identix. Identix, один из крупнейших поставщиков биометрических технологий в США, успешно работает на рынке распознавания внешности. Эванс был приглашен в компанию благодаря связям председателя совета директоров Энзо Тореззи, создавшего в прошлом несколько высокотехнологичных компаний, экс-партнера крупнейшего американского венчурного фонда Accel Partners. Хотя все основные идеи предложили именно Юхин и Климов, процесс их реализации и наращивания сил компании (то, что на венчурном языке называется execution) требует специалиста уже иного типа и уровня. Передать бразды правления в определенный момент - благо для всех: компания получает подготовленного лидера и шанс резко увеличить темпы роста, а основатели - возможность учиться у более опытных мастеров на практике и набираться опыта для своих следующих должностей и компаний. Сегодня специалисты по маркетингу и продажам - самый остродефицитный товар, поэтому приобретение A4Vision можно считать очень сильным (разумеется, Эвансу еще предстоит доказать это делом). А вот не будь у компании венчурного капиталиста "на борде", Эванс вряд ли бы даже задумался, стоит ли ему принимать приглашение от компании без рынка и продукта, даже если б у фирмы были средства платить ему немаленькую зарплату (дешевле 120 тыс. долларов в год CEO просто не бывает) и содержать офис в Силиконовой долине. Опционы же компании без венчурной поддержки в глазах кандидатов в менеджеры и вовсе ничего не стоят. Как нам удалось выяснить, myQube сейчас считает A4Vision едва ли не самой перспективной компанией в своем портфеле. Пока все идет по плану, но, если A4Vision почему-либо сойдет с дистанции и не сможет стать примером для тех, кто еще только собирается пойти по этому пути, второго шанса у нас не будет, возможно, еще очень долго: консервативные американские венчуристы, и так не балующие вниманием отечественных инноваторов, отвернутся от них на годы. Поэтому хочется надеяться, что "горячий" рынок безопасности поможет A4Vision подняться, и компания успешно пройдет главный рубеж - выйдет на безубыточность, начнет расти и будет куплена за десятки или сотни миллионов кем-нибудь вроде Oracle или IBM. А то, с Божьей помощью, и до IPO на NASDAQ дойдет. ***** Биометрический контроль Ныне действующие коммерческие методы распознавания внешности "по лицу" оставляют желать много лучшего. Не так давно компания Visionix (куплена Identix) потерпела фиаско при попытке развернуть свою систему распознавания внешности Argus в аэропорту Палм-Бич. На языке статистики ситуация, когда тест дает сигнал не там, где нужно, носит название "ложного позитива" (false positive), а ситуация, когда тест не дает сигнал там, где нужно, - "ложного негатива" (false negative). Эта проблема существует для всех тестов - стандартной задачей является, например, учебный расчет вероятности того, что тест на ВИЧ дважды ошибочно определит наличие вируса у абсолютно здорового человека. Система тестирования может считаться работоспособной, когда общий процент ложных позитивов и негативов не превышает 1-3% от общего числа тестов. В случае с Visionix, однако, система давала примерно 52,5% "ложных негативов" на базе всего из 15 испытателей-"злоумышленников" (503 неудачных попытки на 958 распознаваний), а "ложные позитивы" на полевых испытаниях составили около 31,3% от общего числа тревог (1081 ложная тревога из 3455). Все это, коротко говоря, означает только одно: система неработоспособна. Методы дактилоскопии и иридодиагностики также далеки от совершенства. В прошлом году немецкий технологический журнал "c't" сообщил об итогах своего исследования 11 различных продуктов, которое показало, что все средства биометрического контроля очень легко поддаются манипуляции. В фильме-антиутопии "Гаттака" герой Этана Хоука, отправленный евгенической комиссией в дворники за плохую наследственность, с трудом и риском для жизни проникает на учебу в запретную для него школу космонавтов, используя взятые напрокат у пловца-олимпийца отпечатки пальцев и контактные линзы для глаз. Если бы подобные методы контроля применялись не в далеком будущем, как в фильме, а сейчас, обмануть их потенциальному звездолетчику не составило бы никакого труда. Системы распознавания лица могут пропустить злоумышленника по предъявлении камере-автомату фотографии или экранного изображения авторизованного владельца. Устройства для дактилоскопии срабатывают, если просто подышать на стеклышко, где остались старые отпечатки пальцев, не говоря уж о таком популярном в голливудских боевиках методе, как силиконовый муляж пальца или оттиска. Даже систему иридодиагностики после нескольких попыток оказалось возможным перехитрить картинкой глаза законного пользователя. /"Эксперт", 21.05.2003/ |