Ия (old_world_blues) wrote,
Ия
old_world_blues

Category:
"All models are wrong, but some are useful."
- George Box


Я сейчас читаю книгу "Algorithms to Live By: The Computer Science of Human Decisions". В книге рассказывается, как различные задачи в жизни (сколько вариантов пересмотреть перед покупкой вещи, как сортировать книги на полке, как получше рассадить гостей за столом) решаются с помощью алгоритмов.

Начало было очень интересным. Рассматривалась проблема момента остановки (optimal stopping).
Представьте, что вам нужно из доступных вариантов выбрать наилучший, скажем, из всех кандидатов на должность нанять самого компетентного. Кандидаты представлены вам один за другим, и, откажи вы текущему, вернуться к нему больше будет нельзя. Каждого кандидата можно сравнить с предыдущими, и, конечно, всегда есть шанс, что следующий будет лучше всех, кого вы встретили до этого.
Если вы наймёте самого первого из N кандидатов, вы не сможете рассмотреть другие варианты, которые, возможно, лучше. С другой стороны, если вы будете слишком долго ждать, вам придётся нанять самого последнего, даже если он хуже всех.
Похожая проблема решается и в ситуациях, когда вы выбираете себе новую куртку, или даже когда думаете, жениться ли на своём текущем партнёре или продолжить поиски.

Возникает вопрос: когда остановиться? Сколько вариантов нужно пересмотреть перед тем, как сделать выбор?
На этот вопрос есть ответ: 37%. Он означает, что нужно рассмотреть 37% от доступного числа вариантов, не выбирая ни один из них, и потом выбрать первый же, который лучше всех предыдущих.
Это не гарантирует, что выбранный вариант действительно окажется самым лучшим. Возможно, самым лучшим был первый вариант, который вы уже упустили. Возможно, самым лучшим является последний, который вы никогда не увидите. Но именно в такой ситуации наиболее высок шанс выбрать лучший вариант.

Например, рассмотрим вполне реалистичную проблему: вы не уверены, стоит ли жениться на человеке, с которым вы сейчас встречаетесь. Вроде бы всё неплохо, но вам особо не с чем сравнить, и вы сомневаетесь: вдруг в будущем вы могли бы встретить кого-то более подходящего? Если подходить к проблеме математически, то сначала следует прикинуть количество серьёзных отношений, которое у вас в жизни может быть.
Это сама по себе сложная проблема, потому что статистика по количеству сексуальных партнёров никуда не годится. Не каждый, с кем человек спит, хотел бы иметь с ним отношения. А из тех, кто хотел бы, не каждый хотел бы завести семью. Тут лучше недооценить, чем переоценить. Думаю, у меня, женщины средней внешности и среднего ума, вряд ли в жизни будет больше трёх мужчин, которые реально хотели бы на мне жениться. Из этого следует, что мне стоило бы отказать первому (составляющему 33% от общего числа вариантов) и выйти замуж за второго, если он лучше первого. В этой ситуации шанс выбрать лучшего самый высокий - 50%.

Чем больше количество вариантов, тем меньше шанс, что вы выберете самый лучший. Например, при 10 вариантах этот шанс составляет всего ~40%, а при 1000 - всего ~37%. Тем не менее, эта стратегия является наилучшей и позволяет максимизировать шанс остановиться вовремя.

Про момент остановки можно было бы написать ещё много интересного, и я уверена, оно и написано. Но не в этой книге.
Дальше автор начинает рассматривать задачи, мало относящиеся к повседневной жизни: сколько раз участники чемпионата должны играть друг с другом, как проложить оптимальный путь через города и т.п.
Как учебник по алгоритмам книга содержит слишком много историй из жизни, а как книга про задачи из повседневной жизни - слишком мало реальных задач. Кажется, будто автор на самом деле хотел писать про алгоритмы, и для каждого старательно искал примеры применения, даже если они не совсем в тему.

В книге есть глава про переобучение - ситуацию, когда модель слишком сильно заточена под имеющиеся данные, и на будущих из-за этого может не очень хорошо работать. А автор приводит в пример задачи, где и модель-то не строится, а решение принимается просто один раз. И переобучением назвал ситуацию, когда человек рассматривает слишком много плюсов и минусов перед принятием решения.

В общем, после увлекательного начала следует слишком уж много информации не по теме.
Tags: science builds the future, книги
Subscribe

  • Полив растений и water table

    Я хочу рассказать об одном интересном моменте, связанном с выращиванием растений. Для меня это в своё время было огромным открытием. Многие люди…

  • (no subject)

    В понедельник наконец-то снова открыли все магазины с растениями (давно пора, они были закрыты с декабря), и я сразу же после работы поехала в…

  • (no subject)

    У меня на балконе много разных растений, но есть те, которые держатся только пару сезонов, а потом решают, что не могут больше жить в этом холодном и…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 10 comments

  • Полив растений и water table

    Я хочу рассказать об одном интересном моменте, связанном с выращиванием растений. Для меня это в своё время было огромным открытием. Многие люди…

  • (no subject)

    В понедельник наконец-то снова открыли все магазины с растениями (давно пора, они были закрыты с декабря), и я сразу же после работы поехала в…

  • (no subject)

    У меня на балконе много разных растений, но есть те, которые держатся только пару сезонов, а потом решают, что не могут больше жить в этом холодном и…