Проект предусматривает создание устного корпуса башкирского языка на материалах средств массовой информации: радио и телепередач. Для этого предполагается сбор аудиоматералов, проведение паспортизации и метаразметки, членение записи информаторов на фразы и синтагмы, проведение транскрибирования в «полуорфографической записи», специально разработанной и максимально приближенной к орфографии современного башкирского языка. тексты будут выставлены в публицистическом корпусе как подкорпус. Такой корпус позволит определить состояние башкирской устной речи на современном этапе, сравнить с письменным литературным башкирским языком, выявить фонетические, лексико-морфологические и синтаксические особенности устной речи. Корпус откроет возможность для разработки орфоэпического словаря, станет базой для социолингвистических исследований.