Послано - 28 Фвр 2006 : 16:56:03
Скрипты для работы с произведениями СИ. -------------------------------------------- Все скрипты работают из командной строки. Нужен перл. У меня стоит версия 5.8.4, но будет работать и более ранняя (наверное).
Get_chaptersauthor_dir match Скачивает главы произведения со страницы автора http://zhurnal.lib.ru/первая буква в author_dir/author_dir/index.shtml, названия страниц которых совпадает с параметром match. В параметре могут использоваться регулярные выражения (regexprs). Примеры: get_chapters shumilowa_o_a pol скачает со странички solali произведение "Монеты в ладони" (pol1.shtml...pol27.shtml) - обратите внимание - во всех страничках есть слово pol - это и есть параметр match! get_chapters stoltidis_s_a nachaloputi скачает со странички Столтидиса С.А. произведение "Снова в пути".
make_txt сформирует из скачанных глав единый файл в формате txt, название файла является единственным параметром, главы должны быть в той же директории, что и make_txt. Тут имеется подводный камень: главы объединяются в том порядке, в каком они находятся в файлменеджере при включенной сортировке по именам (т.е. у solali после главы 1 идет глава 10!!! Поэтому главы с 1 по 9 нужно переименовать с 01 по 09).
Если же все главы на страничке автора (index.shtml! не indexdate.shtml!!!) находятся в необходимом порядке, можно пользоваться объединенным скриптом GET_COMPLETE. С его помощью можно скачивать НЕСКОЛЬКО произведений со странички автора, например get_complete nikolaj_c abstract silver winter скачают со странички Николая Чугунова все выложенные произведения (обе части Стажеров и фанфик на Громыко) и СФОРМИРУЕТ ИЗ НИХ 3 txt файла!
P.S. Также в скриптах закачки можно использовать не только директорию автора, но и страничку-"поддиректорию", например у fieryrat "Черный замок" находится в "поддиректории" (но это уже неактуально, т.к. она объединила свое произведение в 1 файл). -------------------------------------------- Скрипты выложу в следующих сообщениях в таком порядке: get_chapters, make_txt, get_complete
-------------- Фильтр новостей СИ жанра фантастики/фэнтези. Параметры: более 100к или есть слова "глава", "часть" с номером оной.
Послано - 02 Марта 2006 : 11:13:49
2 AVE - спасибо PS Perl у меня есть - я пользуюсь watznew для сбора новостей - а в ней как раз один из вариантов - обработка используя perl. (Только я прихо разбираюсь в деталях этого языка) Нельзя ли получить текст "Фильтр новостей СИ жанра фантастики/фэнтези" ?
Послано - 02 Марта 2006 : 15:52:57
Наверно, полную версию - по крайней мере, можно будет напустить программу на список произведений по фантастике и по фентези ( например http://zhurnal.lib.ru/janr/index_janr_time1-1.shtml )
Послано - 03 Марта 2006 : 11:03:51
Попробовать можно - простенькие выражения на perl я писал (как упоминал для программы watznew). Я совсем не знаю библиотек перла , но если будет пример программы - смогу разобраться (надеюсь) PS Хотя у этого урла один минус - там нет времени обновления.
Цитата: Прошел 21 день. А теперь статистика с сайта rapidshare: Скрипты были скачаны 3 раза. Фильтр - 1 раз.
Никому не надо, похоже...
Надо всем. Но только у единиц есть Perl. И, например, для меня проще сделать самодельный фильтр на чем-нибудь другом. Понимаю, что через задницу получится, но ломы изучать Perl, скачивать, настраивать и разбираться...