Электронные книги: сканирование, обработка, сборка - II

- Электронные книги: сканирование, обработка, сборка - II 1 - - Электронные книги: сканирование, обработка, сборка - II 2 - - Электронные книги: сканирование, обработка, сборка - II 3 - - Электронные книги: сканирование, обработка, сборка - II 4 - - Электронные книги: сканирование, обработка, сборка - II 5 - - Электронные книги: сканирование, обработка, сборка - II 6 - - Электронные книги: сканирование, обработка, сборка - II 7 - - Электронные книги: сканирование, обработка, сборка - II 8 - - Электронные книги: сканирование, обработка, сборка - II 9 - - Электронные книги: сканирование, обработка, сборка - II 10 - - Электронные книги: сканирование, обработка, сборка - II 11 - - Электронные книги: сканирование, обработка, сборка - II 12 - - Электронные книги: сканирование, обработка, сборка - II 13 - - Электронные книги: сканирование, обработка, сборка - II 14 - - Электронные книги: сканирование, обработка, сборка - II 15 - - Электронные книги: сканирование, обработка, сборка - II 16 - - Электронные книги: сканирование, обработка, сборка - II 17 - - Электронные книги: сканирование, обработка, сборка - II 18 - - Электронные книги: сканирование, обработка, сборка - II 19 - - Электронные книги: сканирование, обработка, сборка - II 20 - - Электронные книги: сканирование, обработка, сборка - II 21 - - Электронные книги: сканирование, обработка, сборка - II 22 - - Электронные книги: сканирование, обработка, сборка - II 23 -
2 monday2000 Совсем забыл! Ведь в статье WIA используется как удобный пример, и не более того. Можно сделать макрос для любого другого TWAIN. Astra55 WIA is available in Microsoft Windows Me, Windows XP and later. Да, я быстро сообразил и поискал в Инете. Сдается мне, что от ME можно прикрутить к W98, я в ближайшее время попробую, благо винтов хватает. Astra55 Попробовал дома пообрезать просто с Irfan View. Ничего путного из этого, увы, не вышло. Проблема в том, что у Irfan View нет режима зума вроде "Fit Page" - да и вообще, никак не удаётся отобразить обрезаемую страницу журнала "Техника-Молодёжи" в приемлемом масштабе - там масштаб можно увеличивать не плавно, как хотелось бы, а ступенчато - и причём - огромными "ступенями". Т.е. страница отображается целиком лишь на примерно четвертушке площади рабочего окна, но стоит чуть-чуть увеличить изображение - как страница тут же начинает не помещаться целиком на экране. Что тут можно сделать? Вариант с Фотошопом тоже ИМХО не пойдёт - слишком муторно. monday2000 у Irfan View нет режима зума вроде "Fit Page" Конечно нет - откуда ему там взяться? Правда, на клавишу F навешена непонятная команда, наверное глюкЦитата с другого форума: эх... эти бы алгоритмы ещё бы облечь в доступную простым людям -не-програмистам форму. я думаю, масса людей мечтает о некоей фриишной и небольшой программе -которая сочетала бы в себе лучшие возможности ФайнРидера+Сканкромсатора+Букресторера+РастерИд+Ад обАкробата+ДокЭкспресса и позволяла бы работать со всеми форматами е-буков - и с пдф и с дежавю и т.д.... Комментарии излишни Цитата с другого форума: Я уже занёс ссылку на этот форум сюда в шапку: Сканирование и обработка - Natahaus Родственный форум. Astra55 Alexx S Так как теперь быть с журналами? Пока что я спешным порядком опять засел за учебник по MFC... monday2000 , я тоже сижу под 98. Одна из причин - отсутствие драйвера на сканер под XP. Я его брал в 2001 году. Поэтому сканирую и обрабатываю на 98. ХР только для инета, местный провайдер не может мне его настроить для 98. "Технику - молодежи" резал вручную в ACDSe. Надеюсь такая программа есть? Сама методика здесь (правда она довольно старая, многое упростилось): http://publ.lib.ru/cgi/forum/YaBB.pl?num=1129402551 Или если надо только обрезать страницы: 1. Открываем папку со сканами в броузере ACDSe. 3-й пойдет, он быстрее. 2. Дабл-клик на 1-й странице - она раскрылась на полный экран. 3. Мышкой выделяем вырезаемую область. Область надо "протягивать" одним движением, как в SK не получится двигать границы. 4. По контексту для этой области выбираем "сохранить область как". 5. При необходимости меняем имя и тип файла. Подтверждаем. 6. "Page Down" - открывается следующая страница на поный экран (п. 2) Повторять пока не надоест или не кончатся файлы в папке. Можно пользоваться комбинациями Ctrl+S сохранить, Обрезать - не помню. Недостаток - размер страниц не одинаковый получается +-10 точек. Скорость обрезки - приличная, зависит только от скорости пальцев. Основное время уходит на открытие/закрытие файлов. Можно потратить на журнал не более 10 минут, если не спешить. Lykas Спасибо. Я тоже пока не вижу альтеративы чисто ручной нарезке - для цветных журналов. Разве что взять Фотошоп, а не ACDSee для этого. Короче, и тут надо делать самодельную прогу-какую-то - именно для нарезки журналов, а не книг. Так как теперь быть с журналами? Глубоко вдохнули, глубоко выдохнули и начали опять за рыбу деньги . Читаем: "Открываем первый файл tif в Ирфане, масштаб просмотра должен быть по высоте изображения, при дальнейших операциях нельзя пользоваться масштабированием ни в плюс, ни в минус . Выделяем курсором необходимую область, она выбирается исходя из расчета, что все остальные страницы будут точно такого же размера. В заголовке Ирфана, на синем фоне видим размеры выделения в пикселях, записываем эти значения. Нажимаем Shift+C, что эквивалентно пункту в меню "Правка — Выделить область...". Отмечаем единицы измерения "пикселы", пункт "Соотношение ширины/высоты — Нет", поскольку размеры произвольные, вставляем в графы "Ширина" и "Высота" записанные значения выделения и жмем на "Применить":" Если не получается, то возврат к первой части статьи, где подробно расписаны настройки Ирфана, и в частности - нужный МАСШТАБ при работе со сканами. Ну что Вы как маленький? По каждой операции нужно за руку вести? Все описанное в статье было мной лично проделано не один раз и все работает, причем именно так, как и сказано. Попробуй ручную нарезку в Bookrestore, всяко удобнее чем перечисленные вырианты.2 monday2000 И Вы еще выходите с инициативами по каким-то там будущим софтам? Если не получается воспользоваться чужой инструкцией с большими буквами и красивыми картинками, то что же Вы собрались ваять? На любой копеечный трабл у Вас один ответ -надо делать новый софт. Этот постулат уже начинает приедаться. Тем паче, что изобретаться будет лисапед, и к моменту его появления, даже если таковой настанет, выяснится, что он уже никому не нужен. Уже сейчас с избытком хватает софта для выполнения практически всех задач по сканированию и обработке сканов. Пусть не всегда это так быстро и удобно, как хотелось бы, но практические задачи решаются успешно. А умствовать можно до бесконечности. Старый анекдот - мужик бежит за автобусом. Его знакомый спрашивает - зачем он бежит? Мужик - деньги экономлю. Знакомый - беги лучше за такси, больше сэкономишь . Тогда уж надо мечать о полной автоматизации путем отдания голосового приказа домашнему роботу. "Замесить и нарубить!", как Вовка в тридевятом царстве. monday2000 у Irfan View нет режима зума вроде "Fit Page" Вид/Оконный режим/Масштабировать все изображение по размеру окна ЗЫ: Каждый делает то и так, на что способен на данный момент. И обсуждать способности и умения кого-либо ИМХО не стоит. Не детский сад. monday2000 , Lykas ребята, обратите внимание, по инструкции Astra55 нарезанные страницы получаются одинакового размера , т.к. размер рамки задается заранее и ручная операция заключается только в позиционировании этой рамки. То, что остальные операции -- нажатие клавиш для обрезки сохранения, перехода на след. скан и т.д. -- выполняются автоматически, кроме экономии времени еще и предохраняет от ошибок, неизбежных при обработке большого количества сканов. Arcand Жаль, "Fit page width" (без изменения размеров окна самого Irfan'а) нет. Надо будет как-нибудь Ирфана об этом попросить... Astra55 Если не получается, то возврат к первой части статьи, где подробно расписаны настройки Ирфана, и в частности - нужный МАСШТАБ при работе со сканами. Да, теперь увидел такую информацию в первой части статьи - "Вид/Оконный режим/Масштабировать все изображение по размеру окна" - попробую дома ещё раз обрезать в Irfan View. Вам бы свою методику более как-то структурировать - лучше всего разбейте на несколько маленьких методичек - по этапам создания эл. книги - а ещё лучше - по отдельным задачам - "очистка мусора", "обрезка по размеру", и т.д. Выделяем курсором необходимую область Кстати, я не сразу понял, что это курсор мыши - почему-то подумалось про клавиатурный курсор. И скриншотов ИМХО многовато - это придаёт методичке устрашающий вид. Добавлено: estimated ребята, обратите внимание, по инструкции Astra55 нарезанные страницы получаются одинакового размера, т.к. размер рамки задается заранее и ручная операция заключается только в позиционировании этой рамки. Ну да, пусть хотя бы так - а как ещё можно? Я вот сам уже убедился на опыте, что рамки именно одинакового размера для обрезки Техники-Молодёжи практически достаточно. И скриншотов ИМХО многовато - это придаёт методичке устрашающий вид. Приходит муж к беременной жене в роддом. - Дорогая, хочешь ананасов? - Не хочу! - Хочешь апельсинов? - Не хочу! - Хочешь черной икры? - Не хочу! - А чего хочешь? - Говна хочу! Побежал, принес. - Не такого, хочу свежего! Принес свежего. - Посоли! Посолил. - Поперчи! Поперчил. - Сам попробуй! Попробовал. - Не хочу! Намек понятен? Astra55 Намек понятен? Нет, не понятен. Я Вам просто поясняю на конкретных деталях, почему подобная методичка (Ваша) никак не может пользоваться успехом у широкой аудитории читателей. Всё дело именно в мелочах - где-то лишний скриншот имеется, где-то фраза нечётко прописана - из таких мелочей складывается общее. Лично я, когда пишу статьи, рассчитанные на широкий круг читателей, продумываю каждое слово и каждую мелкую деталь - иначе можно смело выкидывать написанное на помойку. Я, конечно, Вас не заставляю переделывать Вашу статью - просто делюсь конкретными соображениями по улучшению статьи - а это кропотливое и въедливое занятие - такова уж специфика процесса написания статей. monday2000 Лично я, когда пишу статьи, рассчитанные на широкий круг читателей, продумываю каждое слово и каждую мелкую деталь Вот это лучше убрать, иначе сейчас такой флейм начнется... ghosty Теперь ближе к теме. Листал я недавно одну книженцию, изданную УРСС. Все знают, что они печатают на туалетной бумаге и мерзкими расплывчатыми буквами (зато дешево). Теперь я обратил внимание, что строчки текста еще и наклонные (пьяные), что подозрительно напомнило мне сканы, выровненные в FR. Я раньше не понимал, отчего они так плохо печатают, а теперь вижу, что они сканируют прошлые издания, выравнивают в FR и снова печатают прямо сканы. Я не силен в типографских технологиях, поэтому мне показалось это забавным. bolega Владелец УРСС - друг одного моего знакомого - довольно интересная личность. Испанский коммунист-антиглобалист. В России он видит родину коммунистического движения. Его основная задача - завалить нашу страну (а затем и весь мир, ни больше, ни меньше) дешевыми умными книгами. Соответственно, в достижении этой цели хороши любые средства Ну, то есть это не столько даже к теме ближе, сколько к разделу в целом ghosty Вот как чувствовал, что между УРСС и monday2000 есть какая-то связь. monday2000 а как ещё можно? а еще можно каждый раз мышкой растягивать рамку на скане, обозначая обрезаемую область. (Я правильно понял, что ты именно так делал?) Понятно, что при этом - при разумных затратах времени - одинаковые размеры у обрезанных сканов не получатся. Astra55 Зайдешь на форум, почитаешь пару твоих постов - и хорошее настроение на целый день обеспечено Добавлено: Lykas со старыми сканерами обычно идут еще драйвера под NT. Есть большая вероятность, что они заработают и под XP.А Вам всем не надоело долбать monday2000 ? Нашли крайнего. Так и хочется сказатьть что-нибудь русское. Я, конечно, Вас не заставляю переделывать Вашу статью Я, конечно, этого делать уже не буду, хватит сокращенного варианта по быстрым сканам. Могу только посоветовать взять любой редактор html, скомпоновать текст и скриншоты статьи по своему вкусу, выбросив ненужное и оставив только нужное. Только сдается мне, что не будете Вы этим заниматься. Насчет фраз и слов - я достаточно много пишу, поэтому в курсях. Но если вовремя не остановиться, то статьи никогда не будет. Вроде бы излагаю достаточно грамотно и иллюстрировано. Пока что никто не жаловался. Кроме Вас. Но ведь и Вы сами осилили эту статью с бАААльшим трудом. Что не может не печалить и не наводить на всякие мысли, типа - а стОит ли вообще этим заниматься, да пусть каждый трахается как хочет. Неблагодарное это дело, чем-либо делиться, особенно опытом. Я сегодня потратил три часа на установку Win98, за это время ХР несколько раз бы установил. Возьму дистрибут МЕ и попробую приделать WIA от МЕ к 98-м. Заодно оценил прогресс перехода с 98 на ХР, это полный абзац по установке всех дров, а ведь когда-то не так напрягало. Неблагодарное это дело, чем-либо делиться, особенно опытом. По статистике 3-5 % способны воспринять. Не надо особо обольщаться. В этом отношении я спокоен как слон. Тем более, умных хватит на всех. Предлагаю больше не кривляться. Astra55 Что вы такой злой все время? И не надо на monday2000 наезжать, он очень много делает для юных сканировщиков. Он в сети как Мальчиш Кибальчиш, его все благодарят. И труды ваши, Astra55 , ценят. Не стоит бурчать что все плохо и что все тупые. Я читал практически все что было в шапке и все внимательно читал. Вас оценят, но нужно время.Я не злой и не бурчу. Просто когда фонтанирующий энтузиазм не подкрепляется практическими делами, он назвается прожектерством. Лучше выполнимые цели, пусть небольшие, чем призывы народа к явно нереальным свершениям. Еще Христос говорил - много званых, да мало избранных. Вас оценят, но нужно время. Ну да, к моему памятнику на кладбище понесут дискеты и сидюки со статьями и засыплют ими могилу, как цветами. Мне будет очень уютно и приятно в ней лежать . Arcand А Вам всем не надоело долбать monday2000? Не стоит обижать сразу всех В последнее время реакции стали намного спокойнее. Другое дело, мы друг с другом начинаем конфликтовать как-то по инерции уже - такое впечатление, что monday2000 выступает в качестве катализатора. Он же действительно задает вполне нормальные вопросы. Ведь это главное - ответ вообще может быть дан в том и только в том случае, если сформулирован вопрос. Наша беда в том часто и состоит (и та же беда была у monday2000 в свое время), что мы формулируем ответ прежде, чем услышим (поймем) вопрос. Мне будет очень уютно и приятно в ней лежать — Где я? — продолжал Фома, — кто кругом меня? Это буйволы и быки, устремившие на меня рога свои. Жизнь, что же ты такое? Живи, живи, будь обесчещен, опозорен, умален, избит, и когда засыплют песком твою могилу, тогда только опомнятся люди, и бедные кости твои раздавят монументом! — Батюшки, о монументах заговорил! — прошептал Ежевикин, сплеснув руками. — О, не ставьте мне монумента! — кричал Фома, — не ставьте мне его! Не надо мне монументов! В сердцах своих воздвигните мне монумент, а более ничего не надо, не надо, не надо! Достоевский Ф.М. "Село степанчиково и его обитатели"Так извините за вторжение. Читаю здесь, что некоторые работают еще под Win98 из за проблемы с драйверов и т.д. Нельзя так. Может не знаете, под WinXP и выше есть одна программа, VMWare Workstation (последная версия где то около 5.5), которая позволяет запустит другая операционная система под WinXP (а если компьютер помощнее, то несколько одновременно). Каждая операционная система занимает отдельный файл, который и является ее виртуальная машина. Раз однаждый инсталировали операционка, можно етот файл заархивировать и записать на CD для сохранение и востановление. Можно скопировать под другое имя, получив при етом две виртуальные машины, можно их связать в сеть, в интернете. Можно запустит всякие драйвера и сканер будеть работат под такой виртуальный Win98 - я так пользуюсь. Можно в торрент-сетях найти готовые инсталированные операционные системы под VMWare, я сделал себе очень хорошая коллекция Виндовсов и Линуксов. Незаменимое средство для разработка и тестирование софтуера. Очень советую освоить. Astra55 Я не злой и не бурчу. Просто когда фонтанирующий энтузиазм не подкрепляется практическими делами, он назвается прожектерством. Лучше выполнимые цели, пусть небольшие, чем призывы народа к явно нереальным свершениям. Еще Христос говорил - много званых, да мало избранных. Давайте жить дружно! В конце концов люди должны понимать друг друга, не стоит так на monday2000 ругаться, он обидеться... а обижать людей не хорошо. Astra55 если вы мудрый и умный человек вы должны понимать других. VMWare Workstation Очень долго ставить образ ОСи и сильно тормозит при работе. Проще винт переключить, что и делаю. Винты сейчас недорогие и поставить небольшой HDD спецом на win98 несложно. Зато никаких проблем с эмуляцией портов и всего прочего. Arcand Gajver100 Отношусь с большой симпатией к monday2000, поэтому с удовольствием вступаю с ним в споры, иногда яростные (правда, в отличие от него, никогда не переходил на личные оскорбления, но это очевидно, молодость). А в спорах как известно рождается истина. Согласитесь, нет ничего хуже, чем всеобщий блаженный застой и одобрямс. Astra55 Вроде бы излагаю достаточно грамотно и иллюстрировано. Пока что никто не жаловался. Кроме Вас. Правильно. Потому что это тяжёлая обязанность - быть критиком. Если говорить правду и обрисовывать ситуацию так, как она есть - это неизбежно вызовет гневную реакцию критикуемого. Потому-то никто и не хочет это делать. А делать это нужно - без критики прогресс невозможен - а прогресс тут нужен - это в интересах обычных книгосканировщиков. А статья Ваша ИМХО действительно оставляет желать лучшего - в значительной мере. Так что задумайтесь о её переделке. Критикуя чужие статьи/программы, я всегда ставлю себя на место обычного книгосканировщика и пытаюсь сымитировать его реакцию на данную статью/программу. Сам-то я лично могу вникнуть и разобраться - а большинство просто поленятся - и с этим невозможно не считаться . А вот для того, чтобы большинство всё-таки не поленилось прочесть какую-либо статью, надо делать статьи как можно более тщательно и доходчиво - уделяя внимание каждой мелочи. Вот в этом отношении Вам ещё надо многое сделать - в своей этой статье. Могу только посоветовать взять любой редактор html, скомпоновать текст и скриншоты статьи по своему вкусу, выбросив ненужное и оставив только нужное. Только сдается мне, что не будете Вы этим заниматься. Как раз-таки наоборот - я это уже запланировал - сделать статью насчёт обработки цветных журналов. Только я не могу пока определиться: то ли написать статью с описанием использования готовых софтов, то ли сразу начать делать - долго и нудно - самодельную примитивную программу - для нарезки журналов. Добавлено: Кстати, у меня всё-таки наконец получилось вчера вечером дома обрезать сканы одного журнала "Техника-Молодёжи" - при помощи Irfan View - и по описаниям от Astra55 . Пока без макросов - вручную. И ещё я дополнительно нашёл, как сделать цветокоррекцию. Дело в том, что я купил журналы на развале по трояку - так они там лежат в коробках на улице круглый год - от этого они здорово пожелтели, причём неравномерно, и есть местами пятна от жирного супа, наверное. В общем, в 5 Фотошопе сначала делаем (всё это для цветного скана) 1. Применяем "Изображение -> Настройка -> Авто Уровни". Одно лишь это уже резко улучшает цветовое изображение скана - меньше желтизны становится. 2. Затем открываем "Изображение -> Настройка -> Замена Цвета...". Появляется окно с уменьшенным изображением скана. Ставим опцию "Изображение". Затем пипеткой берём пробу жёлтого фона (стараясь пожелтее выбрать), и чуть ниже все три ползунка сдвигаем максимально вправо - чтобы получить в качестве цвета замены белый. Жмём в окошке "ОК". 3. Повторяем п.2 несколько раз, каждый раз выбирая пипеткой наиболее "грязный" заменяемый цвет (у меня это были на вид грязно-жёлтый, потом бледно-жёлтый, потом голубой (!) и светло-голубой). В результате удаётся практически полностью восстановить мерзкий, гадкий пожелтевший цветной скан до яркого, сочного скана, где на белом фоне чёткие чёрные буквы и цветные картинки. Это похоже просто на чудо и волшебство - трудно было даже и представить, что можно до такой степени восстановить мерзко-пожелтевший цветной скан. Добавлено: estimated а еще можно каждый раз мышкой растягивать рамку на скане, обозначая обрезаемую область. (Я правильно понял, что ты именно так делал?) Ну да. Принпип такой: выделяем мышкой обрезаемую область на 1 скане, записываем её 4 координаты в окошко с параметрами обрезающей рамки и жмём OK. При этом координаты обрезающей рамки сохраняются автоматом - поэтому, когда мы переходим к следующему скану и вызываем обрезающую рамку - она появляется точно в том же виде, как мы её сохранили. Затем её можно подправить вручную на данном скане и обрезать - это ручное подправление рамки никак не повлияет на сохранённые размеры/положение рамки. Я ещё практически каждый скан поворачивал вручную на 0.2 - 0.6 градусов. Как ни старайся сканировать ровно - всё равно хоть чуть-чуть, да перекашивается лист. Прямо хоть оптом потом deskew делай. Можно попробовать, кстати, в Растериде deskew сделать. Порадовало также то, что Irfan View спокойно работает со сканами 25-мегабайтного размера, тогда как СК их отказывается переваривать. надо делать статьи как можно более тщательно и доходчиво - уделяя внимание каждой мелочи Я положительно отношусь к конструктивной критике. Но именно к конструктивной. А не "сделайте так, чтобы мне нравилось, но не знаю как именно это должно выглядеть". Ради справедливости, а не за критику в мой адрес - поглядите беспристрастно на свои же собссные творения на своем сайте. Страница "Создание книг в электронном виде из бумажных книг" чудовищная по объему, причем это набор ссылок и прочего, без малейшей попытки систематизировать материал. Что видит новичок? Кучу эпитетов: великолепная.., самый.., и т.д. Если человек еще не знает что ему нужно, у него крыша поедет от мешанины djvu, pdf, графических редакторов и всего прочего. Открываем инструкцию по СканКромсатору и видим точно то же самое. Я бы понял критические замечания, если бы Ваши творения были действительно лучше, никогда не считаю зазорным поучиться у других. Но ведь учиться нечему! Один в один как у меня, но это считается правильным . Для разрядки и поднятия настроения привожу слова А.Пушкина, из тех, что не входят в школьные хрестоматии: ----------------- От всенощной вечор идя домой, Антипьевна с Марфушкою бранились; Антипьевна отменно горячилась. "Постой, - кричит, - управлюсь я с тобой; Ты думаешь, что я уж позабыла Ту ночь, когда, забравшись в уголок, Ты с крестником Ванюшкою шалила? Постой, о всем узнает муженек!" - Тебе ль грозить! - Марфуша отвечает, - Ванюша - что? Ведь он еще дитя, А сват Трофим, который у тебя И день и ночь? Весь город это знает. Молчи ж, кума, - и ты, как я, грешна, А всякого словами разобидишь; В чужой п@#$е соломинку ты видишь, А у себя не видишь и бревна. ----------------- Astra55 Страница "Создание книг в электронном виде из бумажных книг" чудовищная по объему, причем это набор ссылок и прочего, без малейшей попытки систематизировать материал. Совершенно верно - полностью согласен с этой точкой зрения. Я в самом начале той статьи сделал приписку, что статья устарела. Та статья была одна из первых достаточно подробных статей на эту тему - я решил забросить её усовершенствование т.к. взамен лучше и эффективнее заняться BookScanLib. Если бы я её сейчас переделывал - то сделал бы именно так, как Вам советую. Открываем инструкцию по СканКромсатору и видим точно то же самое. Если Вы об этом: http://www.djvu-soft.narod.ru/kromsator/ - то там тоже в самом верху сказано, что пособие далеко не готово. На самом деле, то не статья для конечного пользователя - Пособие по Кромсатору было изначально задумано как исходное сырьё для тех, кто будет писать нормальные статьи для пользователей по использованию СК. Ведь надо же было сначала где-то в одном месте просто собрать всё, что нам известно по СК - а это как раз некая груда беспорядочно-обрывочных знаний. Кстати - я ошибочно перегрузил там всё излишними скриншотами - лишь теперь я это понимаю. Зато взгляните на другие мои статьи - например, вот на эту: http://www.djvu-soft.narod.ru/kromsator/text_smoothing.htm - коротко, чётко, ничего лишнего. Заметьте, кстати - нет ни одного скриншота СК - нафиг они там нужны - и без них всё ясно, что и как делать и что получается в результате. Или вот эта: http://www.djvu-soft.narod.ru/scan/curved_text.htm - тоже - и достаточно короткая, но и достаточно понятная (я её ещё чуть подправлю, как обещал). Скриншоты если и есть - то только такие, без которых будет непонятно, о чём речь. Добавлено: Ещё есть 2 важных общих приёма при написании статей: 1. Автору статьи зачастую кажется, что часть объясняемого материала настолько проста и очевидна, что она и читателю понятна - хотя на самом деле нет. ("Интерфейс TWAIN", например, или "в оттенках серого"). 2. Многие слова, фразы и словесные обороты имеют двойной смысл - ну, то есть, их можно понять и так, и этак - нужно стараться использовать дополнительные поясняющие слова - чтобы смысл объясняемого стал однозначным. (Например, "выделяем часть изображения курсором" - "курсор" - это вообще-то в первую очередь клавиатурный курсор - т.е. палочка с перекладинками, которая в Ворде мигает в открытом документе). Сколько я вот таких неудачно-написанных учебников вузовских и методичек насмотрелся в своё время, за которые ИМХО надо просто руки отрывать (а кое-кого вообще и посадить бы не мешало - чтобы неповадно было всякую дрянь писать идиотскую - где отсутствует элементарная сквозная логика повествования, а то и вообще - откровенные ошибки содержатся). "выделяем часть изображения курсором" - "курсор" - это вообще-то в первую очередь клавиатурный курсор Курсор это и палочка, но большей частью - стрелочка, которая управляет палочкой в том числе, а еще и "рука", и "палец", и много чего . Сейчас уже не DOSовские времена, клавиши управления курсором юзаются куда реже, нежели стрелочка. Другого названия для интерфейса TWAIN, я просто не знаю. Переводить общепринятые английские термины в их несуществующие русские эквиваленты резона нет. Иначе можно докатиться до "самобеглой коляски" вместо "автомобиля" . Если вместо "щелчка правой мышкой" будет нечто вроде: ------------ - Взять в правую руку манипулятор, называемый на жаргоне "мышью", который должен быть предварительно соответствующим образом подключен к компьютеру и правильно установлен на нем, что подразумевает его безошибочное функционирование в рамках установленной операционной системы. - Убедиться, что средний палец правой руки оператора установлен на правую кнопку вышеуказанной "мыши", причем правая кнопка считается относительно горизонтальной оси, проведенной между оператором "мыши" и отображающим устройством, именуемым монитором. - Произвести нажатие средним пальцем правой руки правой кнопки "мыши" путем кратковременного надавливания на нее. После нажатия обязательно поднять средний палец правой руки над правой кнопкой "мыши" для завершения операции по нажатию. ----------- то не замаетесь ли читать? Когда пишутся статьи, то автор обычно подразумевает наличие некоторого образования, а также умения пользоваться книгами и поисковиками для понимания сути профессиональных терминов и компьютерного жаргона. Когда я пришел в виртуальные миры, то мне весь этот жаргон тоже сначала казался непонятным и абсурдным. Пришлось привыкать, то бишь, образование повышать. А как же иначе? Как говаривал один книжный герой, существует только один способ сделать девушке ребенка. Получить знания можно только путем их получения и никак иначе (с) мой! monday2000 : (насчет обрезки) OK, я тогда тебя неправильно понял, извини.Попалась на глаза полезная софтина для любого переназначения клавиш и даже для макросов, очень простая и наглядная. Перезагрузки компа при изменениях не требуется. Есть только один недостаток - трудно сделать паузу, пока что получилось только вставкой многократного нажатия Alt. Полный комплект: _http://rapidshare.com/files/23837730/KeyExt.rar.html - 700 килПосоветуйте, что можно сделать со сканами в формате JPG? У меня уже просто слезы на глазах, качество книги в ДЖВУ получаеться на 3 ((Ресэмплировать до разумного максимума и конвертить в tif. Но из дерьма уже не сделать конфету, этот постулат всегда актуален для jpg.Буду тогда пересканировать... эх, дурак был когда сканировал в JPG... ну что поделаешь на ошибках учаться Почитаешь эту ветку — постоянно одни и те же грабли со сканами. Нужна наверное какая-то памятка для начинающих сканировщиков, по типу Десяти Заповедей Ну там не сканить в FR, не сканить в BW, не сохранять в JPG, не настраивать сканер если не умеешь и т.д.Вот проект этих заповедей Разумеется, без претензий на абсолютную истину. Добавки, корректировки и прочее всячески приветствуются. ------------------ Десять заповедей начинающего сканировщика 1. Делай хорошо, плохо само получится . Не надейся на исправление косяков при сканировании с помощью софта. Лучше пересканировать кривые страницы, нежели пытаться потом их исправить. 2. Белое всегда должно быть белым, а черное черным. Пять минут, потраченные на подбор яркости и контрастности перед сканированием, окупят себя минимальным трудом по завершении сканирования. Запомни, лучше день потерять, потом за пять минут долететь (с). 3. Всегда используй для текста, схем, чертежей и других черно-белых изображений только и только tif, лучше серый. Никаких jpg, gif и прочей экзотики, никаких и никогда! Для черно-белого изображения с разрешением не ниже 600 dpi подойдет tif Fax4, он же CCITT G4, для серого и цветного (если нужно качество) используй tif LZW. В крайнем случае несжатый tif, но позаботься о достатке места на винте. По возможности не используй pdf, особенно в FineReader и уж ни в коем случае не выбирай jpg для уменьшения размера. Никто не осудит за сто мегов отличного качества, но все выругают за десяток мегов грязных, кривых jpg, пусть даже там есть текстовый слой. 4. Твердо запомни, что сканирования с разрешением меньше 300 dpi для тебя не существует! Сканы бывают от 300 dpi и выше. Все остальное - мусор, годный только для отправки в корзину. 5. В сканировании не бывает слишком больших файлов, если все сделано качественно. Ужать файлы можно многими способами, а вот сделать из маленького дерьма большую конфету еще никому не удавалось. 6. Не используй для сканирования FineReader любых версий, он обязательно начнет исправлять изображение и безвозвратно изувечит его. Если хочется сканировать на автомате, то есть другие способы. 7. Старайся все операции по сканированию свести к однотипным, которые не требуют умственных усилий. Это не страшно и не больно - сидишь и переворачиваешь страницы книги, слушая в это время хорошую музыку. Не отвлекайся, если страница легла криво, просто пересканируй ее тут же. Переименовать файлы в нужном порядке можно за секунды, выбиться из ритма легко, а вернуться в него трудно. 8. Глаза боятся, руки делают. Не смущайся сотнями и тысячами страниц, другие сканируют и побольше, чем ты хуже других? Если затошнило от сканирования, сделай перерыв и отдохни. Только не на многие годы . 9. После окончания сканирования обязательно сохрани все сканы до обработки на другой винт или болванку. Потерять труд многих часов, а то и дней, куда дороже, нежели потратить незначительную сумму на CD/DVD болванку. 10. Критически оценивай свои сканы. Если сам себе признаешься что сделано плохо, то еще не все потеряно. Принцип "и так сойдет, и так мне все будут ноги целовать" никого до добра не доводил. Лучше еще раз стиснув зубы сделать все заново, нежели выложить откровенную халтуру. ----------------- Astra55 , вам 5+ баллов! Просто когда я начинал сканировать книги, я даже не знал о существовании формата DJVU, вот и наломал дров, сейчас почитал ваши посты и отказался от файнридера и сканирую только в несжатый тиф или использую сжатие лзв. 6. Не используй для сканирования FineReader любых версий, он обязательно начнет исправлять изображение и безвозвратно изувечит его. Если хочется сканировать на автомате, то есть другие способы. Это вобще больная тема, я МихМих007 (который написал руссификатор к сканкромсатору) тысячу раз объяснял что не нужно сканировать в ФР... вроде умный человек, учиться на одни 5-ки, но он все также упираеться и говорит что меня устраивает на 100% что типа сканирование в ФР мало влияет на качество и все такое... Обидно, он и не знает что если использовать IrfanView 3.98 + Auto Macro Recorder (свободно можно скачать с сайта http://www.readmesoft.com/). Он говорил что типа ему не нравиться сканировать в ирфане что там типа не видно страницы которые ты отсканировал... но нифига, все в ирфане видно, достаточно сверныть окно просмотра изображения TWAIN и все видно еще лучше чем в ФР (больше массштаб отображенного скана). Потом я просто настраиваю Auto Macro Recorder, записываю как я работаю мышкой, задаю временной интервал повоторения 25 сек И ВОТ ОНО! ВСЕ КАК НА КОНВЕЕРЕ! Технологию перенял из статьи "Как быстро сканировать", но считаю что эту статью нужно в оф.топ отправить, слишком сложно написано и много лишнего. Зачем там было приметь WIA, когда и в родном TWAN рамка хорошо настраиваеться... Gajver100 Astra55, вам 5+ баллов! Согласен на все 100%! Может быть эти "заповеди" в шапку вынести..? Gajver100 Зачем там было приметь WIA, когда и в родном TWAN рамка хорошо настраиваеться... И тут Astra55 прав! Интерфейс WIA у всех одинаков, а TWAIN - зависит от типа сканера. Я не использую WIA, но для новичка не умеющего настраивать и разбираться Auto Macro Recorder это то что нужно. Astra55 Десять заповедей начинающего сканировщика В шапку однозначно. (Уже занёс). Только ИМХО "книгосканировщика", а не просто "сканировщика" - а то маленькие непонятки (особенно когда это выйдет за пределы Руборда). 2. Белое всегда должно быть белым, а черное черным. Пять минут, потраченные на подбор яркости и контрастности перед сканированием, Вот это место хорошо бы подробнее обсудить (или я пропустил такое обсуждение?) - как именно это делается - а ещё есть вариант наоборот - сканировать как есть, а потом выравнивать цветность, яркость и т.п. - ИМХО не факт, что это хуже - я только что приводил описание про Технику-Молодёжи на эту тему. 9. После окончания сканирования обязательно сохрани все сканы до обработки на другой винт или болванку. Тут тоже не всё так просто - в каком формате сохранять? Если книги-сыросканы в Grey LZW - так тут на DVD лишь 2 влезет, то же самое по цветным журналам - ИМХО роскошь это несусветная (хотя скоро вроде пойдут HD-DVD). Добавлено: 3. Всегда используй для текста, схем, чертежей и других черно-белых изображений только и только tif, лучше серый. Вот это хорошо бы как-то особенно выделить - жирным, что ли. Ещё предлагаю добавить заповедь - распластывать книжку посильнее, не жалеть её, что рассыпется в переплёте - чтобы область наползающих серых теней была поменьше - а то её никакой программой не вытянешь до нормального вида - сиди потом как идиот по одной буковке вставляй по краю обгрызенному. monday2000 чтобы область наползающих серых теней была поменьше - а то её никакой программой не вытянешь до нормального вида пользуемся кромсатором и будет счастье . 1. Делай хорошо, плохо само получится . Не надейся на исправление косяков при сканировании с помощью софта. Лучше пересканировать кривые страницы, нежели пытаться потом их исправить. Лучше заменить на косяков сканирования , а то получается что при сканировании софт сканера исправляет автоматом эти самые косяки. 2. Белое всегда должно быть белым, а черное черным. Пять минут, потраченные на подбор яркости и контрастности перед сканированием, окупят себя минимальным трудом по завершении сканирования. Запомни, лучше день потерять, потом за пять минут долететь (с). Да, а как перевести эти самые яркость/контрастность в точку белого/точку черного. Для моего сканера есть только они. 3. Всегда используй для текста, схем, чертежей и других черно-белых изображений только и только tif, лучше серый. Никаких jpg, gif и прочей экзотики, никаких и никогда! Для черно-белого изображения с разрешением не ниже 600 dpi подойдет tif Fax4, он же CCITT G4, для серого и цветного (если нужно качество) используй tif LZW. (1) В крайнем случае несжатый tif, но позаботься о достатке места на винте. По возможности не используй pdf, особенно в FineReader и уж ни в коем случае не выбирай jpg для уменьшения размера. Предлагаю вставить: (1) Можно использовать еще и PNG. Размер уменьшится еще примерно на треть. Предлагаю заменить: Не используй графический PDF! Особенно сделанный сохранением из FineReader в формате PDF. Ещё предлагаю добавить заповедь - распластывать книжку посильнее, не жалеть её, что рассыпется в переплёте Начинающему сканировщику пора уже знать, что со своими книгами он может делать все, что ему угодно, а вот если речь идет о чужих/библиотечных, то 1) не факт, что электронную книгу будут читать чаще, чем испорченную библиотечную (в конце концов, эл. книги читают лишь в крайнем случае, когда нет нормальной под рукой), 2) стоит подумать также и о том, какого труда будет стоить библиотечным работниками вылечить изуродованную книгу - ведь нужно будет разрезать ее и переплести вновь Чужие/библиотечные - только ОптикБуком (пока альтернативы нет).Поскольку копирайтов на десяток строчек я ставить не собираюсь, поэтому считайте что была предложена "рыба", которую все вольны править и переделывать по вкусу. Пусть общество само решает что оставить, что выкинуть, а что подправить. Добавлено: Можно использовать еще и PNG. Размер уменьшится еще примерно на треть. Можно. Но не нужно. png уступает tif-у как минимум по частоте юзания. Пусть png остается для вебстраниц и прочего. tif - стандарт для многих практических приложений. В частности, типографии понимают что такое tif, а png - нет. 4. Твердо запомни, что сканирования с разрешением меньше 300 dpi для тебя не существует! Сканы бывают от 300 dpi и выше. Все остальное - мусор, годный только для отправки в корзину. Однако всегда можно сделать скан чуть лучше. 5. В сканировании не бывает слишком больших файлов, если все сделано качественно. Ужать файлы можно многими способами, а вот сделать из маленького дерьма большую конфету еще никому не удавалось. Но скан 1 страницы более 100 мегов - это уже перебор. 6. Не используй для сканирования FineReader любых версий, он обязательно начнет исправлять изображение и безвозвратно изувечит его. Если хочется сканировать на автомате, то есть другие способы. Заменить Используй FineReader только если ты планируешь делать OCR. Но и для этих форматов изображения(иллюстрации?) сканируй и обрабатывай отдельно не в FineReader. 7. Старайся все операции по сканированию свести к однотипным, которые не требуют умственных усилий. Это не страшно и не больно - сидишь и переворачиваешь страницы книги, слушая в это время хорошую музыку. (1) Не отвлекайся , если страница легла криво, просто пересканируй ее тут же. Переименовать файлы в нужном порядке можно за секунды, выбиться из ритма легко, а вернуться в него трудно. Вставить (1) Купи для сканера 5-ти метровый шнур и в соседней комнате можешь смотреть телевизор. Заменить Не отвлекайся на Не растраивайся 9. После окончания сканирования обязательно (1) сохрани все сканы до обработки на другой винт или болванку. Потерять труд многих часов, а то и дней, куда дороже, нежели потратить незначительную сумму на CD/DVD болванку. (2) Вставить (1) проверь все ли страницы отсканировал и . (2) Сохрани сканы и после обработки. После сжатия могут всплыть результаты человеческих или компьютерных ошибок. У меня было такое что делал 700 стр книгу так пришлось собирать по 100 стр. Так вышли одни сотни в ч/б, другие в сером. Тут тоже не всё так просто - в каком формате сохранять? Если книги-сыросканы в Grey LZW - так тут на DVD лишь 2 влезет, то же самое по цветным журналам - ИМХО роскошь это несусветная (хотя скоро вроде пойдут HD-DVD). Посмотрел: PNG A4+ серые от 0,5 до 2,5 МБ. Цветные до 20. 11. Если не устраивает сканер, меняй сканер. Не устраивает компьютер, меняй компьютер. VadimirTT пользуемся кромсатором и будет счастье Я имею в виду такой случай, когда наползающая тень превращается просто в чёрное - у самого корешка - тут ничто не поможет - только выгибать посильнее книжку. ghosty Чужие/библиотечные - только ОптикБуком (пока альтернативы нет). Да, конечно сильно уродовать чужие книжки тоже плохо. Нужно поаккуратнее - но зато переделывать зачернённые у корешка - каторга по 1 буковке вручную - это где совсем уж чёрные поля. Ещё иногда полезно как бы слегка "разломать" в стороны слишком уж тесно склееные книжки. 2. Белое всегда должно быть белым, а черное черным. Пять минут, потраченные на подбор яркости и контрастности перед сканированием, окупят себя минимальным трудом по завершении сканирования. Вообще-то я лично всегда этого не делал - и ничего - нормально. Видимо, это нужно делать всё-таки в каких-то особых случаях. monday2000 Я имею в виду такой случай, когда наползающая тень превращается просто в чёрное - у самого корешка - тут ничто не поможет - только выгибать посильнее книжку. сканить надо в серых тонах и ничего не будет неисправимого, как правило не сольется, вот для минимизации геомискажений, это да, надо использовать недавно анонсированный здесь инструмент . monday2000 Вообще-то я лично всегда этого не делал - и ничего - нормально. Видимо, это нужно делать всё-таки в каких-то особых случаях. Это нужно делать когда сканируешь рисунки цветные или серые, в таких рисунках малоразличима разница между цветами и оттенками и если не отрегулировать, то на рисунке пропадут серые или блеклые места, они просто сольются с остальной частью рисунка. Пример: http://slil.ru/24171690 П.С.: Но зачастую можно не настраивать, а применить автонастройку сканера и он сам подберет нужные параметры, останеться только проверить и немного подкорректировать.Как мне представляется эти "заповеди" адресованы только начинающим сканеровщикам, т.е. людям мало или совсем не понимающим детали этого процесса. Цель этих "заповедей" — получить универсальное сырьё, пригодное для изготовления только ибуксов (любых форматов) и оградить начинающих от распространённых ошибок. Как только пользователь поймёт, что он уже превзошёл уровень начинающего, он получает индульгенцию практически на любой пункт этих "заповедей". Поэтому считаю, что всевозможные оговорки, вроде "Используй XXX только если ты планируешь делать YYY" или "можно сделать так-то, но при условии, что..." здесь просто вредны. Все пункты должны пониматься однозначно (не иметь разночтений) и должны быть выражены в категоричной форме, т.е делай так и только так. Упоминаний конкретных форматов ибуксов тоже быть не должно, это уже должны быть другие "заповеди", конкретно по формату. Astra55 Что в п.1 понимается под "кривыми страницами", криво положенные или плохо прижатые (имеющие искривление строк у корешка)? Если первое, то это не важно, т.к. поворачивать надо практически любые сканы, да и очень часто текст не параллелен листу бумаги. По п.2. Для начинающего вероятность ошибки выбора яркости и контрастности на книгах отечественного производства очень велика и может обернуться пересканированием. Считаю что сканировать необходимо с дефолтными настройками и затем получать нужный результат с помощью стороннего софта. Да, я понимаю, что это увеличивается размер файла и вид получается неприглядный, но в 100% случаев из таких сканов я получал нужный результат, чего нельзя сказать о скананах с неправильно выставленными настройками при сканировании. По п.3. Заменить "лучше серый" на "только серый". Аргументы: чище поворачивается, больший манёвр для исправления огрех сканирования или полиграфии.Можно сколько угодно составлять правила, все едино кпд будет низок. Против законов природы не попрешь. Есть классический эксперимент. В стае обезъян, обучали самую забитую делать нехитрые телодвижения, после которых она получала еду. Остальным обезъянам, в лучшем случае приходило в голву отнять, а не научиться. Но стоило обучить доминантного самца, как практически мгновенно все остальные осваивали новую технологию. В общем, надо искать волосатого, краснозадого, доминантного шимпанзе! Astra55 ИМХО заповеди хорошо получились - только п.2. и п.9 надо бы обязательно пересмотреть - п.2 - ИМХО, если честно - всё с точностью до наоборот (редко когда это нужно делать - сканер регулировать до сканирования), а по п.9 - предлагаю сохранять на болванки только те сканы в CCIT FAX G4, которые непосредственно подаются на DjVu-кодирование - т.е. уже полностью облагороженные - а иначе дорого обходится. По журналам цветным типа "Техника-Молодёжи" - ИМХО можно сканировать их в цветном TIF Uncompressed, обрабатывать-кодировать в DjVu и ПОТОМ, после создания DjVu, делать специально архивную копию - пакетно перегонять Ирфаном готовые сканы в JPG-100% (получится где-то 6-7 МБ на 1 скан) и в таком виде записывать на DVD. А записывать прямо в TIF Uncompressed обработанные цветные сканы - получается по 25 МБ/страница - это ну очень дорого. Сжатие в LZW ничего не даёт в данном случае - файл ни капли не уменьшается. monday2000 ИМХО заповеди хорошо получились - только п.2. и п.9 надо бы обязательно пересмотреть - п.2 - ИМХО, если честно - всё с точностью до наоборот (редко когда это нужно делать - сканер регулировать до сканирования), а по п.9 - предлагаю сохранять на болванки только те сканы в CCIT FAX G4, которые непосредственно подаются на DjVu-кодирование - т.е. уже полностью облагороженные - а иначе дорого обходится. Это грубая ошибка!!! Очень часто находишь страницы которые не правильно обработаны СК!!! И если удалить исходные сканы, то придеться заново брать в библиотеке книгу и перескнировать нужный лист!!! Сохранять на болванку нужно исходные сканы! VadimirTT Можно сколько угодно составлять правила, все едино кпд будет низок. Против законов природы не попрешь. Ну что так мрачно - как раз-таки такие простые и чёткие правила (а главное, достаточно короткие) ИМХО хорошо будут влиять на книгосканирование - хоть будут меньше в джипеги сканировать. Только тут главное - хорошенько продумать эти правила. Быть может те, которые сомнительные, убрать - тут подумать надо. Есть классический эксперимент. А это уже законы рекламы. Astra55 , Вам бы сайт себе сделать с рецептами по сканированию книг - туда бы эти заповеди и поместить - на первую страницу. Плюс Ваши обе методички. CHM-ки же Вы делать умеете - а сайт - это куда как проще в техническом плане - и обслуживания сайт не требует никакого - зато много плюсов. Вы же спец у нас по готовым софтам всяким - так что будет материал для сайта. (Заодно и ОптикБуки там прорекламируете - мною нелюбимые ). Добавлено: Вот забыл: может, стоит добавить в заповеди насчёт не-использования FR-опции "заменять неуверенно-распознанные символы картинками" - лучше просто в DjVu целиком. VadimirTT доминантного шимпанзе! А зачем это делать? Я вот собираюсь завтра сходить и поговорить с начальством краевой библиотеки. Предложить им технологию, рассказать о софте который применеться для изготовления книг, рассказать тонкости, про сканеры для сканирования книг
Флейм (4)
Пора уже открывать, блин. Kaylang Пора уже открывать, блин. Интересно, какое слово ты потом поправил? или убрал? Отмечусь в новом флейме Всех с майскими праздниками отметился)С новосельем всех и с праздниками! Пеереехали?document.write("<\/a>")