K сожалению, в магазинах выбор аудиокниг невелик, заказанные в интернете долго ждать, да и не накупишься этих промышленных дисков. Другое дело - самому создавать звуковые книги. Нужно просто научиться озвучивать тексты на компьютере и записывать их в аудиофайлы. Перекинуть потом эти файлы на карманный МРЗ-плейер, КПК, обычный "кассетник" и даже на "мобилу" - дело техники.
В этой статье мы не будем вдаваться в технологические тонкости синтеза речи, а сразу дадим четкую инструкцию по созданию аудиокниг. Для решения этой задачи нам понадобится, прежде всего, голос, который наговорит нашу книжку, и программа, умеющая записывать речь в МРЗ.
ЧТО ТАКОЕ АУДИОКНИГА
Для начала давайте разберемся с самим понятием "аудиокнига". Дословно - это "звучащая книга" или "книга, прочитанная вслух". Исходя из этого определения, можно точно сказать, что записи различных радиопередач - это все-таки спектакли, постановки, разыгранные на голоса, а никак не аудиокниги. По существующему западному стандарту аудиокнига должна быть озвучена одним голосом, содержать минимум музыкального сопровождения и всевозможных эффектов (вроде шума моря, шелеста дождя или криков птиц). В идеале таких посторонних звуков в аудиокниге не должно быть вообще, если они и есть, то чуть-чуть, между главами.
Многие из тех, кто "подсел" на аудиокниги, "выслушивают" в день от трех до пяти часов озвученного текста (в месяц это занимает 80-140 часов). Чтобы вы смогли представить объем "проглатываемой" таким образом информации, приведем эквивалент нижней границы в других единицах: 85 часов звучат 10 томов Бориса Акунина об Эрасте Фандорине (4,3 Мб).
А теперь в денежном измерении. Некоторые аудиокниги можно скачать бесплатно в файлообменных сетях, но этот вариант только для тех, кто не платит за трафик из собственного кармана. Цена средней озвученной книги на Горбушке - 100 рублей, в приличном магазине - 200 рублей. Таким образом, за всю эпопею с Фандориным придется выложить от 1000 до 2000 рублей. И это при условии, что книги эти озвучили и выпустили в продажу на дисках, что редко бывает, к сожалению. Вот почему "слушающим книги" людям так нужен в хозяйстве личный чтец, который бы озвучивал любые произведения.
ГОЛОС "НИКОЛАЯ"
"Приятный дикторский голос прочтет вам эти книги" - такое описание имеющихся в продаже аудиокниг можно встретить на некоторых сайтах в интернете. Если цена таких книг подозрительно низка (порядка 50 рублей за книжку или диск), не спешите делать заказ - скорее всего, эти книги озвучены одним из синтезаторов речи, в частности голосом Digalo Russian Nikolai.
Этот голосовой модуль является самым популярным среди людей, активно использующих синтез речи для прослушивания книг, и действительно обладает довольно приятным тембром. А спешить с заказом не стоит по той причине, что с помощью этого голосового движка вы сами сможете озвучить любое количество книг, не затратив при этом ни копейки. Нужно оговориться: конечно же, при наличии самой программы-синтезатора. И здесь возникает резонный вопрос: где взять этого "Николая" (будем так называть этот голос для краткости).
ЧТО СТАРЫЙ, ЧТО НОВЫЙ
Обычно при упоминании русского движка Digalo подразумевается одна из версий программы 2000 года - Digalo 2000. Именно она в основном используется для синтеза речи, и именно ее дальше по тексту мы будем называть старым "Николаем". Более свежую версию движка -Digalo 2003 - мы даже не будем рассматривать, поскольку управляется она только родной оболочкой, совершенно "не видится" программами-говорилками, а по качеству синтеза ничуть не лучше Digalo 2000. К сожалению, на сайте программы (wwwdigalo.com) "висит" как раз эта неуправляемая версия 2003 года, и по этой причине ее оттуда скачивать не нужно. Старого "Николая" можно найти в Сети без затруднений (например, здесь: doublestyle.comi.ru/mp3book/download.html). Поскольку программа не поддерживается хозяевами, за регистрацию ее давно никто не платит.
Внятность речи - главное достоинство старого "Николая", из-за которого многие терпят и его недостатки. Движок работает под управлением MS SAPI 4.x и в наименьшей степени поддерживает ее спецификацию. В результате на фоне других добропорядочных движков наш "Николай" зачастую оказывается "рыжим" - для него невозможно задать возраст чтеца, поставить смысловое ударение, заставить говорить шепотом или использовать интонацию (восходящую или нисходящую) и много других "не". Однако самый большой его недостаток в том, что нельзя записывать синтезированную речь в аудиофайл в ускоренном режиме (что это за режим, расскажем чуть позже).
Совсем недавно появилась новая версия "Николая" (wwwelantts.com). Теперь программа называется по-другому - Speech Cube Rus (Nicolai). Этот "Николай" работает и под SAPI 4, и под SAPI 5, но остается таким же "рыжим" и обладает тем же голосом, что и старый. Однако новый "Николай" (будем так называть версию движка 2005 года) излечился от некоторых старых болезней. Он теперь не сбоит на глючных словах (не боится ни "уколов", ни "приставов") и длинных паузах, но самое главное - позволяет записывать речь с ускорением.
Кроме того, у нового "Николая" намного шире диапазон настраиваемых параметров речи. Если скорость чтения у старого "Николая" находилась в пределах от 70 до 190 условных слов в минуту, то у нового - от 17 до 850 слов. Правда, такие широкие возможности вряд ли кому пригодятся на деле - при значении этого параметра выше 250 слов уже ничего не воспринимается, а при скорости ниже 50 синтезатор бормочет заплетающимся языком алкоголика. Значительно расширен и частотный диапазон нового "Николая": от голоса человека, перенесшего трахеотомию, до кастрированного в раннем детстве старика.
Демо-период нового "Николая" - 30 дней. Затем вам придется платить за регистрацию, однако сумма разработчиками не афишируется.
ЗАПИСЬ В GOVORILKA -"НА ЛЕТУ" И БЕСПЛАТНО
Как и было обещано в самом начале статьи, мы расскажем о бесплатном способе записи аудиокниг. Будем считать, что хотя бы одного из "Николаев" вы уже нашли в Сети и установили. Теперь понадобится программа-оболочка, умеющая не только воспроизводить текст голосом этого движка, но и записывать синтезированную речь в аудиофайл. Как нельзя лучше для этой цели подойдет бесплатная программа Антона Рязанова Govorilka (www. vector-ski.com/vecs/govorilka), представляющая собой интерфейс к голосовым движкам, поддерживающим MS SAPI 4.x. Чтобы Govorilka "увидела" обоих "Николаев" в числе доступных голосов, необходимо установить компоненты этого самого SAPI 4.x (wwwmicrosoft.com/msagent/downloads/user.asp). (Что именно скачать и для чего это все нужно, можно найти на сайте Govorilka).
Далее все просто: нужно открыть текстовый файл в Govorilka, установить приемлемые настройки речи (скорость, тембр и голос), задать имя файла, в который будет производиться запись, и нажать на кнопку начала чтения. Звука при записи слышно не будет.
Настройки программы для записи в аудиофайл по умолчанию выставлены оптимальные, поэтому ничего менять в них не стоит. За исключением пункта "Не читать нумераторы" - если его не отключить, то не будут читаться не только эти нумераторы, но и любые цифры в тексте. Режим записи "на лету", также включенный по умолчанию, подразумевает, что программа будет записывать книгу сразу в МРЗ без создания промежуточного несжатого wav-файла, а это сильно экономит место на жестком диске во время записи. Наличие этого режима является уникальной возможностью Govorilka, и, конечно же, ею стоит воспользоваться.
Битрейт (качество записи) - 32 kbps - вполне достаточен для прослушивания речи. Повышать этот параметр нет необходимости - это приведет лишь к значительному увеличению полученного МРЗ-файла. Тем более что размер этого файла в Govorilka ограничен 60 Мб. А это уже накладывает ограничение на размер текста, который можно записать в программе за один сеанс - примерно 200 кб. Большую книгу для записи в Govorilka придется предварительно "драть" на мелкие кусочки, что не совсем удобно. Размер этих кусочков лучше делать не превышающим 50 кб - это соответствует примерно одному часу звучания записанного аудиофайла.
Есть в Govorilka возможность записи с повышенной скоростью, и это действительно работает со всеми движками, но только не с нашими "рыжими". Какую скорость ни выбирай - что для старого "Николая", что для нового - запись идет только в реальном времени. Сколько положено книжке звучать, столько времени и уйдет на ее запись (85 часов для 10-томной эпопеи про Фандорина).
Самое печальное то, что все это время вы ничего больше не сможете делать на компьютере - процесс записи использует все системные ресурсы.
ЗАПИСЬ СТАРЫМ "НИКОЛАЕМ" В MAX-READER - УСКОРЕННАЯ И ПО СЦЕНАРИЮ
Считается, что заставить старого Николая записывать книги в ускоренном режиме невозможно стандартными методами. Александр и Максим Васильевы, авторы другой программы - Max-Reader (maxreader.narod.ru), сумели обойти программные ограничения производителя голосового движка на ускоренную запись. Обычным пользователям эта возможность теперь доступна за дополнительную плату вместе с приобретением утилиты.
Как бы то ни было, а в этой программе книгу можно записать ускоренно - в 30-70 раз быстрее, чем она звучит реально. В результате те же 10 "фандоринских" томов в Max-Reader запишутся за 1,5-3 часа вместо положенных 85, как в Govorilka.
Для такой ускоренной записи в программе рекомендуется использовать версию старого "Николая" от 18.04.2000, со всеми известными недостатками которой авторам Max-Reader удалось справиться. При использовании других версий "Николая" появляются дефекты в выходном аудиофайле и резко падает скорость записи. Плюс ко всему более свежие версии "Николая" мало того, что не имеют никаких преимуществ, так еще и привносят свои недостатки. Например, "Николай" от 21 августа того же 2000 года произнесение любой цифры сопровождает звуком "и" ("два-и", "три-и" и т. д.). Запись же новым "Николаем" идет в Max-Reader в реальном времени, и, что удивительно, текст при этом проговаривается вслух, причем с периодическим искажением, как на заезженной пластинке.
Впрочем, нужная версия "Николая" (как и многие другие голосовые движки, а также компоненты SAPI 4.x) устанавливается вместе с Max-Reader по умолчанию, так что особо забивать голову этими премудростями не стоит.
Не стоит и гадать, каким же образом в программе реализовано ускорение - пусть это останется секретами программистов. Однако из наблюдений за работой этой утилиты можно предположить, что в прежних версиях Max-Reader авторы каким-то образом связали это ускорение записи с системными часами. Во время записи стрелки часов неслись как угорелые, и к концу записи могли уйти на целый месяц вперед. Нужно было возвращать часы назад, и, если это не было сделано сразу же, возникали некоторые неудобства - например, электронные письма уходили и приходили с еще не наступившей датой. В ныне существующей версии Max-Reader 5.6 от 18 марта 2005 года ускорение сделано более корректно и никак не затрагивает систему (во всяком случае, часы с ума не сходят).
Реальное ускорение при записи зависит от параметров озвучивания, в некоторой степени от самого текста и от того, одним или двумя голосами он озвучивается. Дело в том, что в Max-Reader встречающуюся в русском тексте иностранную речь можно заставить проговаривать другого чтеца. Например, в "Турецком гамбите" Акунина очень много предложений на французском языке, и логично озвучить их французской версией движка - Digalo French Robert. Таким образом, наш "Николай" будет читать русский текст, а "Роберт" - французский. При использовании двух синтезаторов запись книги замедляется, но в то же время на компьютере с процессором Celeron 850 и 250 Мб ОЗУ наблюдалось ускорение в 20 и более раз! Если заставить "Николая" читать иностранный текст, то скорость можно повысить дополнительно. Однако лучше этого не делать - читать такой текст программа будет не по правилам иностранного языка, а как обычную латиницу.
Еще одно достоинство Max-Reader - наличие сценариев записи, которые несколько компенсируют непривычный для обычных пользователей интерфейс (программа специально сделана для слабовидящих людей). Достаточно однажды записать любимые настройки в сценарий, и потом можно совершенно забыть о них. Нужно просто открыть хоть десять текстов (именно столько окон в программе) и нажатием на кнопку МРЗ запустить процесс их записи в аудиофайл. После завершения процесса вы получите то, что заказывали: аккуратно разложенные по папкам МРЗ-файлы определенного размера, аудиофайлы для записи на кассеты и даже готовый CD с записанными на нем аудиокнигами. Очень приятно, что программа предварительно обсчитывает необходимое дисковое пространство и примерное время записи - это позволяет, например, подобрать комплект книг, которые точно поместятся на диске.
ТРУДНОСТИ НОВОГО "НИКОЛАЯ"
Как уже говорилось, новый "Николай" поддерживает оба стандарта SAPI - и 4-й, и 5-й. Но чтобы увидеть, как работает движок под управлением SAPI 5, нужна программа-оболочка, также понимающая этот стандарт. Одной из таких программ является Talker Pro компании "Сакрамент" (wwwsakrament.com), однако записать новым "Николаем" с ее помощью ничего не удалось. Вернее, программа записывала только часть текстов, останавливаясь случайным образом на обычных словах, которые никак нельзя назвать сбойными. Кроме того, в Talker недоступны настройки голоса нового "Николая" и можно изменить лишь скорость чтения. Нужно сказать, что и под управлением SAPI 4 с настройками нового "Николая" имеются проблемы - в Govorilka все параметры этого голоса фиксируются (невозможно перетащить ползунки настроек), а в Max-Reader ползунки перетащить можно, но голос остается без изменения.
ЗАПИСЬ НОВЫМ "НИКОЛАЕМ" В МРЗВ00К2005 - УСКОРЕННАЯ И НЕ МОНОТОННАЯ
Программа Владимира Шойтова MP3book2005 (wwwmp3book.best-host.ru) создавалась специально для записи аудиокниг в формате МРЗ, поэтому имеет все необходимые инструменты для комфортного выполнения этой задачи. Программа работает с голосовыми движками и под SAPI 4, и под SAPI 5, что само по себе является уникальным. Кроме того, она обладает интересными возможностями, отсутствующими у других программ-говорилок.
Начнем с возможности ускоренной записи. Любую книгу в этой программе можно записать с ускорением до пяти раз голосом нового "Николая" под управлением SAPI 5.
Нужно отметить, что реализовано это ускорение стандартными (его родными, "дигаловскими") средствами, поэтому компьютер будет работать в штатном режиме, без каких-либо разгонов и переводов времени.
Теперь о преимуществах такой записи. Компоненты SAPI 5 уже установлены в Windows XP, поэтому не нужно тащить тяжеловесные файлы с сайта Microsoft, как в случае записи под SAPI 4. Уже отмечалось, что новый "Николай" не подвержен сбоям на "плохих" словах и имеет широкий диапазон тембров и скоростей. Последнее обстоятельство делает возможной ускоренную запись на обычный магнитофон (диктофон) с переключением скоростей. Другими словами, можно записать книгу на высокой скорости, а слушать на пониженной. Сделать это можно не в любой программе-говорилке, поскольку у многих из них параметры голоса жестко фиксируются. MP3book2005 автоматически опрашивает параметры каждого голосового движка, установленного в системе, и на регуляторах выставляет только допустимые максимальные и минимальные значения параметров для конкретного выбранного голоса. При переходе от одного голоса к другому это можно заметить визуально - регуляторы как бы "перепрыгивают".
Еще один плюс записи новым "Николаем" под SAPI 5: совершенно не тормозится компьютер. В связи с этим и ускоренная запись становится не такой актуальной, поскольку одновременно с этим процессом можно работать и даже играть в 3D-игры. MP3book2005 при этом еще и сворачивается принудительным образом, дабы не мешать вашей работе или игре (кстати, развернуть программу до конца записи даже не пытайтесь - это невозможно).
Программа поддерживает многокомпьютерную обработку - отличное решение для тех, кому пятикратное ускорение записи новым "Николаем" покажется недостаточным. Например, задействовав сразу пять компьютеров, вы получите ускорение записи в 25 раз! Эту же возможность можно применить и при записи старым "Николаем", который, как и в Govorilka, в MP3book2005 пишет в режиме реального времени - ускорение будет равно числу компьютеров, задействованных в процессе записи.
Отдельно нужно рассказать об интересной возможности MP3book2005 изменять тембр и скорость звучания голоса "Николая" в диалогах, комментариях и простом тексте. Реализовано это в "Блоке диалогов" программы. Потаскав ползунки в этом блоке, можно нажать на специальную кнопку и прослушать тестовую фразу с заданными настройками.
"После того, как были сделаны все необходимые настройки, решено было проверить результаты. "Ну и как? Вы удовлетворены результатом? - сказал компьютер своим скрипучим голосом. - Если удовлетворены, то можете сохранить настройки". И после этого пользователю ничего не оставалось, как согласиться с машиной, поскольку он знал, что с таким голосовым движком лучшего добиться нельзя".
Например, здесь простое повествование (до и после прямой речи) можно сделать неторопливым и с привычным тембром голоса. Прямую речь озвучить более высоким голосом, а слова автора, наоборот, более низким. В общем, простора для экспериментов достаточно, а записанная с такими настройками аудиокнига будет звучать не так монотонно.
С помощью MP3book2005 можно записывать аудиокниги не только в МРЗ, но и в форматах для сотовых телефонов, что позволяет прослушивать книги на мобильных устройствах, имеющих достаточную свободную память: все смартфоны, Siemens SL45 и все телефоны 65 серии, LG G1800 и т. д. Автор программы планирует встроить и поддержку цифровых диктофонов.
Интерфейс MP3book2005 представляет собой удобный для пользователя браузер, в котором непосредственно отображается содержимое файла, если на нем стоит курсор. Это дает возможность сразу видеть все произведение и облегчает жизнь в тех ситуациях, когда мучаешься вопросом "Что бы такое "почитать"?"
Незарегистрированная MP3book2005 сохраняет все функции и не имеет никаких временных ограничений, но постоянные напоминания и сброс индивидуальных настроек делают работу с ней очень неудобной (особенно в режиме записи МРЗ-файлов). Регистрация обойдется в 500 рублей.
ПСИХОЛОГИЧЕСКИЙ МОМЕНТ
Прослушивание книг - занятие для настоящих фанатов, для тех, кто воспринимает информацию на слух лучше, чем с листа. Многие любители-"говорильщики" жалуются на непонимание близких: "Как можно слушать эту бормоталку?!" Вот почему новичкам в этом деле можно посоветовать для начала установить бесплатную Govorilka, озвучить "Николаем" и прослушать несколько небольших текстов. Если такое "чтение" придется по вкусу и возникнет потребность слушать книги вдали от компьютера, тогда можно подумать и насчет покупки серьезных программ - Max-Reader и MP3book2005. Кроме комфортной и ускоренной записи аудиокниг эти программы предлагают массу других замечательных возможностей, например, они помогут привести в порядок вашу электронную библиотеку, разбросанную по разным закоулкам на диске.
Немаловажно, что обе программы имеют режим продолжения записи после сбоя - свет ли выключат, или Digalo "вылетит" на последней строчке записываемой книги - начинать все сначала не нужно. Но главное, с помощью этих программ вы на всю жизнь обеспечите себя хорошим "чтивом" - аудиокнигами, которые сделают вашу жизнь более наполненной. Взять, к примеру, рыбалку: поймаете ли вы за день хоть одного сопливого ерша - еще вопрос, а вот удовольствие от прослушанной книги получите точно.
ПЕРЕД ТЕМ КАК НАЧАТЬ ЗАПИСЬ
Несмотря на наличие в программах многотысячных словарей по корректировке произношения "Николая", некоторые слова в книге все же окажутся проблемными. Особенно это касается имен, фамилий, географических названий и мудреных терминов. Поэтому перед тем как запустить запись в аудиофайл какой-то необычной книги вроде "Бардо Тодол" ("Тибетской Книги Мертвых"), стоит проверить правильность звучания наиболее часто встречающихся в этом произведении слов. Сделать это можно с помощью программ, умеющих составлять рефераты и аннотации по заданным текстам - например, "Либретто"
(wwwmedialingua.ru/annotator.html) от "МедиаЛингва" или "ОРФО" (wwworfo.ru) компании "Информатик". Можно и не ходить далеко, а воспользоваться простейшим аннотатором, встроенным в Microsoft Word. Полученную любым способом аннотацию нужно сохранить в отдельный файл, а затем прослушать в программе-говорилке, обращая особое внимание на ключевые слова ("Сидпа", "Хониид", "Чикай" в "Книге Мертвых"). То же самое лучше проделать и перед записью "нормальной" книги.
ДРУГИЕ ГОЛОСОВЫЕ ДВИЖКИ
Выбор "голосов" для озвучивания книг невелик. Ниже приведен список голосовых движков, доступных обычным пользователям.
- L&H TTS3000 Russian (wwwmicrosoft.com/msagent/downloacls/user.asp) - создан компанией Lernout&Hauspie, поддерживает MS SAPI 4.x. Распространяется бесплатно корпорацией Microsoft в составе компонентов Microsoft Agent.
- Sakrament TTS Engine (wwwsakrament.com/main.php?Topld=30) - разработан белорусской компанией "Сакрамент", полностью соответствует MS SAPI 5.1. Можно купить за $32 в комплекте с Sakrament TTS Engine Home Edition -многокомпонентным продуктом для персонального использования.
- "Говорящая Мышь" (wwwsciencepark.ru/voicem.htm) - движок Клуба голосовых технологий при научном парке МГУ, использует собственные библиотеки для воспроизведения голоса, поэтому не требует установки MS SAPI. Стоит порядка $20 вместе с программой-оболочкой.
- ScanSoft TTS (wwwscansoft.com/net-work/tts) - серия голосовых движков компании "Скансофт". Демо-версии, как и информация о цене продуктов, предоставляются только серьезным корпоративным покупателям. Простые смертные могут воспользоваться интерактивным сервисом, синтезирующим речь по заданной фразе.