Поисковые запросы Bing впечатляют. Разве Microsoft никого не пускала за кулисы своей поисковой технологии? Пробовал http://www.discoverbing.com, но не смог найти ответ на свой вопрос.

9
Murali VP 24 Окт 2009 в 01:22

2 ответа

Лучший ответ

Исторически Microsoft использовала функцию ранжирования нейронной сети в качестве функции ранжирования. Нейронная сеть объединяет сотни переменных, связанных с URL-адресом для ранжирования. Paper Они обычно оценивают более 100 документов. используя подробный ранкер. Каждому узлу запроса нужно будет отдельно оценить свои основные документы и вернуть их агрегатору. Ранжирование на самом деле очень сложное, и алгоритмы подсчета очков обычно многоуровневые.

Для вычислительных задач, генерации факторов и т. Д. Microsoft Search использует SCOPE, который, как мне кажется, построен на основе Dryad, но не используйте DryadLINQ. SCOPE - это, по сути, язык SQL поверх кластера.

На самом деле Microsoft гораздо более открыто говорит о своих технологиях поиска, чем Google. Microsoft Research Asia и Microsoft Research Silicon Valley

8
Steve Severance 24 Окт 2009 в 20:16

Это информация из вторых рук, но я понимаю, что они используют инвертированные индексы (индексы?) Для поиска первых 100 или около того результатов, а затем они используют набор нейронных сетей, чтобы несколько раз сузить его до 10 лучших, 3 лучших, а затем найти первую.

Они делают это, потому что считают, что первое попадание - это то, что заставляет пользователя думать, что поисковая система работает или нет. Если вы ищете CNN и не получаете CNN.com в качестве первого запроса, пользователи думают, что движок не работает.

Опять же, это знания из вторых рук. Я слышал об этом от друга, который какое-то время работал в MS в их поисковой команде.

0
Jeremy Powell 24 Окт 2009 в 01:32
И уменьшение карты на самом деле не является частью «поискового» алгоритма. это просто способ разбить проблему на параллельные части. говоря это, они, вероятно, используют что-то подобное.
 – 
Jeremy Powell
24 Окт 2009 в 01:34
Согласился, что это не алгоритм, который выполняет поиск, а чтение документов Google, рейтинг страницы (основа качества результатов Google) использует этот алгоритм, поэтому он связан с поиском.
 – 
Murali VP
24 Окт 2009 в 01:41