Надиктовать текст (запись речи)

  1. Создайте проект
  2. Добавьте пул заданий
  3. Загрузите задания
  4. Запустите пул и получите результаты
Совет.

Сначала запустите проект в Песочнице. Так вы сможете избежать ошибок и потраченных средств, если окажется, что ваше задание не работает.

Задания для записи речи удобнее всего запускать для выполнения в мобильном приложении для Android и для iOS. Мобильные приложения позволяют записывать звук прямо в задании через встроенный диктофон устройства.

Возможно, для вашего задания нужны дополнительные проекты, например предварительная проверка датасета или проверка ответов исполнителей. Подробнее об этом читайте в разделе Декомпозиция задания.

Предположим, вам нужно собрать аудиозаписи, в которых пользователи произносят ваш текст. Для этого создадим такое задание: исполнителю будет предложена текстовая фраза и должен приложить аудиозапись в качестве ответа.

Пример готового задания

Чтобы запустить задания и получить ответы:

Создайте проект

Проект определяет, как будет выглядеть задание у исполнителя.

  1. Выберите шаблон:

    1. Нажмите кнопку + Создать проект.

    2. Выберите шаблон Запись речи на диктофон.
  2. Заполните общую информацию:

    1. Дайте проекту понятное название и краткое описание. Их увидят исполнители в списке доступных заданий.

    2. По желанию добавьте Приватный комментарий.
    3. Нажмите кнопку Сохранить.
  3. Отредактируйте интерфейс задания:

    1. Интерфейс задания описывает, как будут расположены элементы задания.

      В HTML-интерфейсе можно использовать стандартные теги HTML и специальные выражения в двойных фигурных скобках для полей входных и выходных данных.

      <div class="text">
        {{phrase}}
      </div>
      
      <div class="record">
        {{field type="file" sources="RECORDER" fileType="AUDIO" name="audio_record" 
        label="Открыть диктофон для записи"}}
      </div>
      Эта запись означает, что задание будет выглядеть так:
      • текст из входного поля phrase;
      • кнопка для запуска диктофона и записи файла, который будет сохранен в поле audio_record.

      Блок JavaScript оставьте без изменений.

      В блок CSS добавьте стили для корректного отображения на мобильных устройствах. В простейшем случае пример ниже:
      .task {
        display: block;
        margin-bottom: 20px;
        margin: 0;
        padding: 20px;
      }
      .text {
        font-size: 18px;
        font-weight: bold;
        line-height: 23px;
      }
      .record {
        margin-top: 5vh;
      }
    2. Определите, какие объекты будете передавать исполнителю и получать от него в ответ. Для этого необходимо создать поля входных и выходных данных в блоке Спецификация данных.

      Что такое входные и выходные данные?

      Входные данные — типы объектов, которые будут подаваться исполнителю для выполнения задания. Например, текст, картинка, географические координаты.

      Выходные данные — типы объектов, которые будут получены после выполнения задания. Например, один из нескольких вариантов ответа, введенный текст или загруженный файл.

      Подробнее о полях входных и выходных данных.

      В данном случае:

      • Поле входных данных — строка phrase, текст, который должен произнести исполнитель.
      • Поле выходных данных — файл audio_record, аудиозапись, которую должен загрузить исполнитель.
    3. Нажмите кнопку , чтобы увидеть получившееся задание. Средствами браузера уменьшите разрешение экрана, чтобы убедиться, что задание будет выглядеть корректно на мобильных устройствах.

      Примечание. В предварительном просмотре проекта отображается одно задание со стандартными данными. Количество заданий на странице вы сможете настроить далее.
    4. Нажмите кнопку Сохранить.
  4. Напишите инструкцию для исполнителей:

    1. Напишите краткую и ясную инструкцию (см. советы). Опишите в ней, что надо сделать, и приведите примеры.

      Вы можете подготовить инструкцию в формате HTML и вставить её в редактор. Чтобы переключиться в режим HTML, нажмите <>.

    2. Нажмите кнопку Завершить.

Добавьте пул заданий

Пул — это набор оплачиваемых заданий, которые одновременно выдаются исполнителям.

  1. Откройте проект и нажмите Добавить пул.
  2. Дайте пулу любое удобное название и описание. Они доступны только вам, исполнитель будет видеть только название и описание проекта.
  3. Установите цену за страницу заданий, например $0.02.
    Что такое страница заданий?

    На одной странице может отображаться одно или несколько заданий. Если задания простые, то можно добавлять 10–20 заданий на одну страницу. Не рекомендуем создавать длинные страницы, поскольку это снизит скорость загрузки данных у исполнителя.

    Исполнитель получит оплату, только если выполнил все задания на странице.

    Количество заданий на странице вы определите при загрузке заданий.

    Как определить справедливую цену?

    Общее правило формирования цены — чем больше времени исполнитель тратит на выполнение, тем выше цена.

    Вы можете зарегистрироваться в Яндекс.Толоке как исполнитель и узнать, сколько платят другие заказчики за задания, а также посмотреть примеры стоимости различных типов задач.

  4. Укажите Время на выполнение страницы заданий. Его должно быть достаточно, в том числе для чтения инструкции и загрузки задания. Например, 1200 секунд.
  5. Установите Перекрытие — количество исполнителей, которые должны выполнить задание. Значение зависит от того, сколько вариантов одной и той же фразы вы хотите собрать. Если достаточно одного, поставьте 1.
  6. Если в задании не будет взрослого контента в любом виде, отключите Контент для взрослых.
  7. Включите опцию Отложенная приемка и укажите количество дней на проверку в поле Срок проверки. Например, 7.
  8. Добавьте Фильтры для отбора исполнителей. Чтобы задание было доступно исполнителям, владеющим русским языком, в мобильных приложениях Яндекс.Толоки, выберите готовый набор фильтров Мобильные русскоязычные исполнители.
  9. Сохраните пул.

Загрузите задания

Подготовьте собственный файл с заданиями. Ознакомьтесь с примером в демонстрационном TSV-файле. Его можно найти на странице пула. В верхней части страницы слева есть ссылки на TSV-файл с обычными, контрольными и обучающими заданиями.
  1. Нажмите кнопку Загрузить. В открывшемся окне также можно скачать пример TSV-файла по ссылке Пример загрузочного файла.
    Что такое TSV?
    TSV-файл — это представление электронной таблицы в виде текстового файла, в котором столбцы разделены знаком табуляции.
    Вы можете работать с ним как в редакторе электронных таблиц, так и в текстовом редакторе, а затем сохранить в нужный формат. Подробнее о работе с TSV-файлом.Существует формат CSV, схожий с TSV, но при загрузке необходимо использовать TSV-файл.
    Примечание. Перед загрузкой файла убедитесь, что он сохранен в кодировке UTF-8.
  2. Добавьте в него входные данные. Заголовок столбца с входными данными содержит слово INPUT. Заполните колонку INPUT:phrase текстами, которые нужно надиктовать, остальные колонки нужно убрать.
  3. Загрузите задания, выбрав Указать вручную и установив,например, 5 заданий на странице. Это значит, что на одной странице будет 5 фраз и исполнителю нужно будет приложить 5 аудиофайлов.

Запустите пул и получите результаты

  1. Запустите пул, нажав кнопку .
  2. Следите за выполнением в блоке Статистика пула.
  3. Начинайте проверку, как только получены первые результаты. По истечении установленного срока все ответы будут автоматически приняты вне зависимости от качества ответа.

    Чтобы проверить задания и скачать приложенные файлы, откройте пул и нажмите кнопку Скачать результаты, а затем Скачать вложения.
    Примечание. Формат файлов, получаемых из мобильных приложений Яндекс.Толоки, — WAV 16KHz 16bit PCM.

Решение проблем

Как в задании записать текст на диктофон одним аудифайлом, чтобы текст надиктовало около 1 тыс. человек?

Для Толоки задачу нужно декомпозировать. Задание на 30 минут для одного человека со всеми фразами лучше разбить на отдельные фразы и предложить разным исполнителям. Шаблон для создания задания такого типа не потребует от пользователя установки отдельного диктофона.

Возьмите наше пошаговое описание создания задания по записи фраз на диктофон.

Во входных данных можно передать фразу, которую должен произнести исполнитель (включить навигацию), и скорость речи (normal speed). Эти данные вам и нужно будет записать в TSV-файл. О создании файла и его структуре можно прочитать в Руководстве.

В предпросмотре по умолчанию 4 задания на странице. Их количество для вашего проекта можно будет указать при загрузке файла с заданиями. Подробнее о предпросмотре.

Например, если вам нужно, чтобы один человек произнес одну и ту же фразу 10 раз, сделайте на странице 10 заданий. Стоимость указывается за целую страницу. Определить, сколько человек должно произнести ту или иную фразу, можно с помощью перекрытия в пуле. Кстати, не забудьте о фильтрах в пуле, чтобы отобрать только исполнителей, владеющих русским языком и выдать задание на мобильном: клиент = мобильная Толока.

Вы можете поручить проверку записанных фраз другим исполнителям, создав отдельный проект. Как это сделать кратко описано здесь.

Как показывать исполнителям два разных варианта текста?

Если вы передаёте тексты во входные данные, то достаточно загрузить в пул 2 разных задания: в одном из них в поле INPUT: <имя входного поля> вы передадите текст № 1, в другом — текст № 2.

Если текст в самом шаблоне задания, в блоке HTML, то нужно клонировать проект. Чтобы исполнитель мог сделать только одно задание в вашем проекте, используйте правило Выполненные задания. Можно назначить навык или заблокировать исполнителя, после того, как он отправит один ответ.

Исполнитель не может загрузить файл в задание?

Если никто из исполнителей не смог отправить задание, скорее всего проблема в валидации в JS. Проверьте её ещё раз.

Перенесите проект в сендбокс и попробуйте выполнить задание самостоятельно в песочнице.

Как сделать так, чтобы при нажатии на изображение оно увеличивалось максимально?

Добавьте к компоненту для вставки картинки параметры real-size=true и screenshot=true.

Не загружаются файлы с Яндекс.Диска

Если картинки, аудио или видео с Яндекс.Диска не отображаются в инструкции или на странице задания, убедитесь, что вы правильно подключили Диск и загрузили файлы.

Как сделать задание, в котором исполнитель должен просматривать видео с Яндекс.Диска?

Для создания задания возьмите за основу шаблон для разметки видео.

Чтобы разместить ваши видеоролики на Яндекс.Диске, его нужно подключить и настроить проект.

Подробная видеоинструкция об этом в нашем блоге.

Почему в задании по выделению объектов на изображении не отображаются изображения с Яндекс.Диска?
Проблема в шаблоне задания. Проверьте, что:
  • Для поля входных данных, куда вы передаете ссылку на файл, в проекте указан тип «строка».
  • В компоненте в шаблоне задания используется выражение proxy.
  • Формат относительных ссылок в TSV-файле с заданиями указан верно: <уникальное имя>/<путь и имя файла>.
Подробная инструкцию и видео на странице Использование файлов с Яндекс.Диска.
Частые ошибки при подключении Диска и загрузке файлов
  • В настройках проекта в поле Входные данные указан тип ссылка. Необходимо выбрать тип строка.
  • В TSV-файле указаны абсолютные ссылки на файлы для заданий. Необходимо вставить ссылку вида <уникальное имя>/<путь и имя файла>. Например: yadisk/image1.jpg или yadisk/photos/image1.png.
  • Фото с Яндекс.Диска используются в инструкции к заданию в мобильном приложении. Чтобы фото отобразилось в инструкции, используйте только прямые ссылки.
  • Файлы удалены или находятся не в той папке на Диске, на которую ведет ссылка.
  • OAuth-токен не активен. Обновите токен на странице Интеграция с внешними сервисами.
Чтобы файлы, загруженные на Яндекс.Диск (картинки, аудио, видео), отображались у исполнителя, нужно:
  1. Подключить Яндекс.Диск в профиле.
  2. Установить тип строка для поля входных данных.
  3. Вставлять ссылку на файл при помощи компонента proxy.

Подробная инструкция

Файлы на Яндекс.Диск загружаются слишком медленно. Как ускорить загрузку?

Попробуйте воспользоваться рекомендациями с этой страницы или написать в службу поддержки Яндекс.Диска.