Як я вчора став кандидатом технічних наук

96

Trololo beautiful ukrainian brides for marriage.

Перш за все хотілося б сказати спасибі всім тим, хто вітав мене в твіттері, по телефону, в аську і іншими способами. Я довго я йшов до цього дня, але трохи розповім передісторію.

Наукою я зацікавився на 4му курсі університету і так ми познайомилися з моїм науковим керівником, у якого я писав диплом і до якого потім вступив до аспірантури. Спочатку наші дослідження були спрямовані на прогнозування і займатися я повинен був би прогнозуванням, якщо б не одне АЛЕ. Цим АЛЕ став інтернет. Та це було приблизно два роки тому.

Я поліз в інтернет, став вивчати просування сайтів, потім дізнався принцип заробітку на партнерських програмах, і всякі прогнози стали мені малоцікаві. Навіть більше, я завів свій блог і мені стало ще цікавіше копатися в інтернет і зовсім нецікаво в прогнозуванні. Знову-таки, було одне АЛЕ. Я вступив на безкоштовну очну форму навчання, місця в якій були розписані на кілька років вперед для своїх. Як мені це вдалося, непринципово, але було б дуже негарно взяти і кинути на півдорозі.

І тут мій керівник поспілкувавшись зі мною про всі ці інтернети, запропонував попрацювати в області інформаційного пошуку, а саме в області підвищення пертинентности (не плутати з релевантністю) інформаційного пошуку – відповідності інформаційної потреби користувача з знайденою інформацією. Ну і понеслося.

Так з’явилася категорія теорія сео, так з’явилися пости релевантність — як вона розраховується пошуковими системами, пост про посилальне ранжування, пост про авторитетність сторінки, розповідь про внутрішні фактори ранжирування і як вони можуть бути розраховані. Ці пости були написані якраз за матеріалами моєї дисертації. І ви знаєте, що називається, поперло. Мені стало цікаво писати дисертацію далі. А доробок за прогнозами ми в підсумку красиво притягли за вуха до інформаційного пошуку. Трохи нижче розповім як.

Власне суть дисертаційної роботи. Для підвищення пертинентности ми пропонуємо у відповідь на один запит отримувати видачу декількох джерел (ми використовували пошукові системи yandex, google, пошук по каталогу dmoz.org пошук yandex серед сайтів, розташованих в dmoz, пошук google серед сайтів, розташованих в dmoz). Джерел у нас було п’ять таким чином. До речі кажучи, видача відрізнялася, в деяких випадках помітно.

Потім ми всю цю купу документів об’єднували в одну купу і переранжировали в тому числі на підставі цієї формули релевантності. Алгоритмів переранжирования (переупорядковування) можна було придумати безліч, наприклад виводити користувачеві лише три верхні позиції з кожного джерела, або сортувати на підставі ступеня довіри до пошукової системи.

А далі те саме було найцікавіше. Примусовим чином (наприклад плагинчик для firefox) ми змушували користувача зробити оцінку задоволеності його інформаційної потреби від переглянутого документа. Природно, ці оцінки ми зберігали і тим самим збирали цікаву статистику. Ці дані ми обробляли, усредняли і як раз прогнозували. Якщо прогноз летів вниз, що означало з підсумку за середнім значенням низьку пертинентность пошуку, то приймалося рішення про зміну алгоритму переранжирования. Якщо ж все було в межах норми, то система продовжувала працювати в штатному режимі.

Все це було описано з великою кількістю формул, була розроблена меотдика експертної оцінки пертинентности, були придумані показники для порівняння видачі декількох джерел. Було багато всього зроблено. Не думаю, що конкретні деталі не будуть дуже цікаві основній масі читачів цього блогу, тому викладати їх сенсу не бачу. Хто захоче ознайомитися, пишіть на мило.

Ну і кілька слів про те, як це було. Я приїхав в Москву напередодні і випадково потрапив в офіс Яндекса на вулиці Льва Толстого на #poseedelki про стартапи. Є звіт про цю справу на форумі стартаперів. У мене було відчуття, що нелегка не дарма мене занесла в яндекс і на захисті мені це стане в нагоді. Так і було. Коли мені натякнули, що вже є чимало сервісів, які використовують декілька джерел для пошуку і в чому взагалі сіль, я відповів так: «Ви знаєте, я вчора був в Яндексі і мені там розповідали, що їх пошук найкращий; нещодавно був на конференції в Казані і гуглоиды розповідали що у них просто хороший пошук яким вони його роблять». Тим самим було знято невдоволення і якесь напруження в аудиторії, де відбувався захист, і ми продовжили подальшу дискусію з відповідями на питання.

Ще раз дякую всім за підтримку, життя знову змінилася в цікаву сторону. Тепер у мене буде набагато більше часу для інтернетів.

До речі, вчора було дуже багато цікавих подій: дня народження Михайла Шакіна, ап видачі яндекса, день варення серч, позитивне рішення про додавання блогу в Яндекс-каталог, та й багато чого ще, я думаю. Ну а ввечері, за традицією 200 км з Москви до Рязані за кермом, які пролетіли досить бадьоро. Крім того, я думаю, що на наступному тижні остаточно здам всі справи в офлайні і звільнюсь від дядька. Але про це я думаю буде окремий пост, коли все відбудеться. Вдалих вихідних, незважаючи на те, що сьогодні і завтра робочі дні.

Терехов.

Сьогодні хотів би вам запропонувати цікаве відео про острів дельфінів.

Постової – блог про фріланс.