СоХабр закрыт.

С 13.05.2019 изменения постов больше не отслеживаются, и новые посты не сохраняются.

Пробуем сделать чтение RSS удобнее: группировка по тегам в черновиках

Есть такая проблема: каждодневные 1000+ непрочитанных постов в RSS ридере. Читать всё и всегда? Нет, спасибо, можно потратить время с большей пользой. Не читать вообще? Тоже не то. В итоге, читаю как получится и что успею. Но даже читая какой-то фид или фиды из определенной категории, приходится профильтровать немного «воды». А в голове уже давно сидела идея, что нужно, чтобы заголовок поста нарезался на теги и посты группировались по этим тегам. Беглый осмотр rss-ридеров, показал, а точнее, ничего не показал.
Руки зачесались, а значит выход только один — велосипедить свой RSS-ридер. В итоге получился rsstag.tk. Так называемый «proof of concept», чтобы понять, имеет ли идея право на жизнь. Данную версию я, более или менее, стабилизировал чтобы пользоваться самому. И решил, протестировать идею на хабралюдях. Топорный интерфейс и домен .tk должны дать понять — это только прототип. Живет все на 5-долларовом digitalocean’е, так что аккуратнее. Вот так это выглядит:



Как этим пользоваться?

Никаких регистраций не требуется. Если вы не будете обновлять посты 172800 секунд(относительно UTC), то база «забудет» про ваше существование. Поддерживаемые RSS-сервисы\провайдеры: Яндекс.Подписки, InoReader, BazQux.
Для начала работы жмем на «Select provider», выбираем RSS-сервис, вводим\разрешаем, что надо. И после редиректа на главную страницу жмем на «Refresh posts» и ждем озеленения строки «Status». Теперь жмем на «Posts grouped by tag», ну или на «Posts grouped by category». На странице с постами есть немного горячих клавиш, жмем “help” или клавишу “H”. И да, мне еще далеко до гуру интерфейсостроения.

Под капотом

Backend — python3+werkzeug+jinja2+mongodb. Frontend — jQuery. Для генерации тегов на русском языке используется pymorphy2, для английского NLTK. Nginx — для https, статики и проксирования. В качестве wsgi-сервера используется тестовый сервер из werkzeug, так как для использования uwsgi и других «взрослых» серверов, придется немного переписать воркеры и работу с ними, а это делать лень да и пока нет необходимости. Исходники не показываю, потому что в таком состоянии их не стоит показывать. Но если хотите поднять свой сервер или попилить под себя, пишите в комменты или личку, скину, мне не жалко.

The end

Я уже немного подсел на такой тип чтения rss. Например: хорошо видно тренды, совсем недавно теги «киев» или «майдан» всегда выплывали вверх первой страницы, а тег «смартфон» вообще не сходит с первых страниц. Конечно, 1000+ непрочитанных постов никуда не пропадают, но стало удобней фильтровать да и просто интересно понаблюдать. И я уже думаю, что всем бесплатным RSS-ридерам нужно сделать у себя группировку по тегам и, нежно и ненавязчиво, показывать контекстную рекламу. Например: под тегом «apple» можно рекламировать яблочный сок.
На этом все, пишите в комментариях кто что думает.
Нужно или не нужно?

На источнике поста проголосовало 23 человек. Воздержалось 11 человек.

комментарии (7)

+1
mrTuborg ,  

Продать в Feedly не планировали? Они как раз ищут дополнительные идеи для монетизации.

0
KRen ,  

Ну странно за такое деньги просить, ничего сверхестественного не придумывал, тем более, коммент ниже показывает, что уже что-то подобное есть.

0
mrTuborg ,  

Продать не обязательно за деньги ))) За общественное порицание признание например

0
OhMyNuts ,  

Лучше всего это реализовано в NewsBlur, там еще есть «умный» фильтр по тегам, который подсвечивает/дает фильтровать по выбранынм тегам, или просто не показывает помеченные, советую обратить внимание, написано все так же, на Python'e еще и опенсорс

0
KRen ,  

Спасибо, гляну.

0
UksusoFF ,  

В Tiny Tiny RSS можно фильтры и теги делать, я например сваливаю что попало под не «интересные» фильтры в одну папку.

0
KRen ,  

Да я тоже сваливал, но интересней, когда за тебя кто-то сваливает ))