Краткий конспект выпуска радиопередачи «Точка».
Время выхода в эфир: 14 ДЕКАБРЯ 2014, 22:07.
«С. Оселедько
― Добрый вечер. И, собственно говоря, повод, для того чтобы нам собраться – это новость о том, что компания Яндекс открыла большое подразделение, посвященное big data, Yandex Data Factory. И, собственно говоря, для нас это стало поводом для того, чтобы собраться и обсудить, собственно говоря, что это такое за зверь, потому что слово очень модное, уже в узких кругах известное, наверное, в течение пары лет как минимум. И, собственно говоря, что это, зачем это, что это нам несет, и почему, собственно, Яндексу это тоже стало интересно – вот такая наша сегодня тема. Давайте, кто даст определение, что такое big data и зачем?
А. Хайтин
― Компания Яндекс, собственно, практически с момента рождения занимается большими данными, то есть, мы растем вместе с ними. Поскольку интернет – такая довольно большая вещь, одна из самых больших мест, где создаются, обрабатываются, используются данные, то для того, чтобы построить наш поиск и другие сервисы, мы с самого начала неизбежно занимались тем, что постоянно удерживались на лидирующих позициях в возможностях хранения, обработки и использования больших данных.
С. Оселедько
― То есть, big data – это технология, которая предназначена для того, чтобы принимать некие решения, да? То есть, извлекать некий смысл из огромного набора абсолютно не структурированных разнородных данных.
А. Шмид
― Коллега из Яндекса совершенно прав в том, я присоединяюсь к его мнению, что данные собираются не вообще, а под задачу. И вот этот процесс называется декомпозицией информационной потребности. Как раз искусство в том и состоит, чтобы найти в предметной области те источники, которые понадобятся. Это может быть все что угодно, от интернета и так далее, это вот список бесконечен. Вот задача главная.
С. Оселедько
― Понятно. Здесь я правильно понимаю, что ключевым значением в этих системах big data является экспертное обучение? То есть, это, собственно говоря, самая важная, самая ценная часть системы.
А. Шмид
― Пока что у человека должно возникнуть желание об информационной помощи, о том, чтобы кто-то ему ответил на какие-то вопросы. И все эти системы так и делятся: информационно-справочная, система поддержки принятия решений, наконец, экспертные системы, сами принимающие решения, без человека. Простейшей системе, которая сама принимает решения, тысяча лет – это капкан. Вот она стоит и ждет. Наступил кто-то с нужным весом – она захлопнулась, приняла решение. Все просто на самом деле.
С. Оселедько
― Александр, наше время подошло к концу. Большое спасибо. На самом деле технологии big data, оказывается, уже давно с нами. На этой оптимистичной ноте нам пора заканчивать. В студии был ведущий программы Сергей Оселедько, и с нами был Александр Шмид, доктор технических наук, профессор, завкафедрой Высшей школы экономики, директор Центра компетенций IBM Big Data…»
Источник: http://echo.msk.ru/programs/tochka/1454822-echo/