Toloka

TSV-файл с заданиями

Данные для заданий загружаются в Толоку в TSV-файле. Образец файла для вашего проекта можно скачать по ссылке Пример загрузочного файла (tsv) на странице пула.

Заголовки столбцов:

Чтобы самостоятельно сформировать наборы заданий, добавьте пустую строку после заданий каждого набора. Если вы используете «умное смешивание», наборы формируются автоматически, пустую строку добавлять не нужно.

В примере файл содержит два набора заданий. Данные для задания: URL картинки и URL веб-страницы (столбцы INPUT) и правильные ответы (столбец GOLDEN:result).

Дополнительные поля для заданий, которые выбираются на карте
Если пользователь выбирает задания на карте, добавьте координаты центра этой карты в столбцах:
  • Al:latitude — широта.

  • Al:longitude — долгота.

Координаты должны совпадать у всех заданий в наборе.

Правила заполнения TSV-файла:

  • Названия полей должны совпадать по регистру с идентификаторами входных данных.

  • URL нужно указывать с префиксом www или http://.

  • Кавычки в строках должны быть парными.

  • В поле можно включать несколько абзацев и строки с табуляцией. Для этого текст надо заключить в кавычки.

Максимальный размер файла — 100 Мб.

Ошибки в TSV-файле

Если поля в TSV-файле заполнены некорректно, при загрузке файла вы увидите сообщение об ошибке. Сообщение содержит информацию о типе ошибки и месте, в котором она обнаружена.

Пример сообщения об ошибке:

"4": {
        "success": false,
        "payload": {
            "exception_msg": {
                "4.image": {
                    "code": "INVALID_VALUE",
                    "message": "[ValidationError{name='', key='INVALID_URL', message='invalid url', params=null}]"
                }
            }
        }
    }

Ключ "4" в примере указывает на номер строки с ошибкой (отсчет начинается с единицы и включает строку заголовка). Типы ошибок приведены в таблице.

Текст ошибки

Описание
"exception_msg": "unexpected end of file while reading quoted column beginning on line 2 and ending on line 5

Одно из полей содержит незакрытую кавычку (").

"payload": [{"name": "values.0.value.2", "key": "NON_NULL", "message": "may not be null"}]

Поле обозначено как обязательное во входных данных и оставлено пустым в TSV-файле. Индекс values.0.value.2 в примере указывает на место ошибки:

  • value.0 — первое поле (отсчет начинается с нуля).

  • value.2 — третье задание (отсчет начинается с нуля).

"exception_msg": "the nameMapping array and the sourceList should be the same size (nameMapping length = 3, sourceList size = 4)

Количество полей в одном из заданий не совпадает с количеством полей в заголовке. В примере в одном из заданий заполнено четыре поля вместо трех.

"message": "[ValidationError{name='', key='INVALID_URL', message='invalid url', params=null}]"

Формат URL в поле с типом «URL» некорректный. URL должен содержать:

  • Префикс www или http://.

  • Домен верхнего уровня (например, .ru, .com).

"payload": [{"name": "values", "key": "FIELD_IS_REQUIRED","message": "field image-left is required","params": ["image-left"]}]

Поле обозначено как обязательное во входных данных, но не добавлено в TSV-файл.