Вечный вопрос: что посмотреть в свободное время, чтобы не было мучительно больно за бездарно потерянные полтора-два часа жизни

Published: 11.01.2015

Необязательная к прочтению статья о личных предпочтениях.

Собственно, сабж. У каждого свои вкусы и не такая долгая жизнь, чтобы посмотреть вообще всё, каждый хочет смотреть только самое лучшее и интересное.

Увы, персонально для каждого, неизбежно попадаются скучные фильмы. И чтобы хоть как-то минимизировать их число, можно пользоваться всякими рейтингами, или киноблогами, или гаданием по И цзин.

Но не все рейтинги одинаково полезны, — и в них также приходится копаться, чтобы подобрать интересный фильм.

Внимание! Реклама! Не переходите по ссылке, если не знаете, как работает протокол HTTP! ]:> Итак, наткнулся я на очередной рейтинг: "1000 лучших фильмов в истории мирового кинематографа", с применением авторского метода ранжирования.

Ну и начал смотреть всё подряд, что можно было найти в сети (некоторые фильмы есть только на английском, или с английскими субтитрами), начиная с 1000-го места. И тут мне как пошла карта! Всё, что ни посмотрю — всё интересно.

— И в самом деле, — сказал я себе, — чего гоняться за сомнительными новинками: рейтинг мне по вкусу, этой тысячи фильмов лет на десять хватит. И это не может не радовать.

А данная статья вообще бы не возникла, если не одно "но". Создатель вышеозначенного сайта заблокировал возможноть выделять и копировать текст, чтобы далее вставлять его в строку поиска. Приходилось выуживать название фильма из HTML-кода.

Really? Что за жлобство? Боязнь копирования своего драгоценного списка? Оно, конечно, понятно, что неискушённому пользователю интернета придётся возвращаться на данный сайт за каждым следующим фильмом, да и я бы так делал, это не трудно. Но дополнительно вызывать Firebug, чтобы добраться до текста — отстой.

Однако, всё, на каждый хитрозакрученный сайт (в данном случае — не очень) найдётся свой парсер с резьбой.

Таким образом, был написан простенький парсер на Питоне, который вытащил для меня всю тысячу в один текстовый файл.

Если кому-то надо, то вот:
CSV — можно открыть в MS Excel или LibreOffice Calc (delimeter is "|").
HTML — HTML-таблица, оптимизированная для CSS-стилизации

Я выбросил столбцы с баллами рейтинга, оставив только значимую информацию. К тому же, согласно описания медодики составления рейтинга, он будет периодически обновляться, так что за актуальным состоянием рейтинга прошу обращаться к первоисточнику. Я же актуальные версии отслеживать не буду, мне теперь и так хорошо.