ОЦЕНКА ЗАМЕТНОСТИ РАСХОЖДЕНИЯ МЕЖДУ ВИДЕО И ЗВУКОМ В ЦИФРОВОМ
КИНЕМАТОГРАФЕ
THE EVALUATION OF RELATIVE TIMING OF SOUND AND VISIO IN DIGITAL
CINEMA
Одним из основных критериев качества воспроизведения аудиовизуального
контента является степень синхронности аудио и видео сигналов. Существует
ряд причин, по которым происходит нарушение синхронности. В телевидении
искажения являются квазипостоянными и возникают на больших интервалах
времени. Особенности восприятия органов слуха и зрения человека
накладывают определённые ограничения на возможные рассогласования
потоков аудио- и видеоданных. Существуют нормативы, задающие допустимые
значения несинхронности аудиовизуальной последовательности. В процессе
производства кино на стадии озвучивания возникает более сложная
проблема локальной синхронизации аудио- и видеоряда на коротких
интервалах времени. Задержка между изображением и звуком носит псевдослучайный
характер, имеет переменную длительность и знак. На данный момент
механизм восприятия человеком импульсных сдвигов является неизученным.
Стандарты, задающие пороги заметности и допустимости расхождений
видео и звука, ориентированы на квазистатичную задержку, возникающую
преимущественно в телевидении. В настоящее время актуальной задачей
является оценка чувствительности зрительного анализатора и органов
слуха к искажениям, возникающих при локальном рассогласования звука
и видео в процессе озвучивания кино. Целью данной работы является
сравнительный анализ проявления заметности несинхронности статического
и импульсного типа и определение факторов, влияющих на их субъективное
восприятие.
В докладе представлены результаты экспериментов по субъективной
оценки несинхронности а/в контента. В целях преемственности результатов
исследования с существующими нормативами были проведены аналогичные
эксперименты по субъективной оценке степени несинхронности а/в материла
при внесении статичной задержки. Сравнение полученных данных с рекомендуемыми
в стандартах и установление закономерности дало возможность проведения
принципиально новых исследований заметности импульсных рассогласований
аудио и видеоряда, характерных для кинематографа. Для этого последовательно
моделировались условия возможных нарушений, (расхождений аудио-
и видеоряда) при озвучивании. Эксперименты проводились в соответствии
с рекомендацией ITU-R BT.500. В качестве тест материала использовали
запись диктора новостей. Оценка велась по процедуре «The double-stimulus
impairment scale (DSIS) method (the EBU method)». Участникам эксперимента
демонстрировались пары клипов, первый из которых являлся оригиналом,
во втором были расхождения во времени между видео и звуком. В бланках
участники экспериментов должны были поставить балловую оценку их
впечатления о степени несинхронности во втором сюжете в сравнении
с оригиналом.
Сравнительный анализ проявления заметности несинхронности статического
и импульсного типов дал статистически значимую разность результатов
восприятия аудиторией подобного рода искажений. Это позволяет сделать
вывод о невозможности применения существующих стандартов на рассогласование
потоков в телевидении к несинхронности, возникающей в кино при дублировании,
озвучивании.
В ходе проведения экспериментов обнаружилось, что одним из основных
факторов, влияющих на восприятие человеком степени синхронности
а/в материала, являются артикуляционные характеристики произносимого
актёром (диктором) текста. Существует набор звуков с активным и
пассивным произнесением. Была проведена оценка заметности импульсного
сдвига одного слова, с учётом её артикуляционных характеристик и
активности произнесения на восприятие степени синхронности аудиовизуального
контента в целом. Результаты статистического анализа подтвердили
гипотезу о том, субъективное восприятие импульсных сдвигов набора
звуков с активным произнесением отличается от подобных сдвигов звуков
с пассивным произнесением.
|