Год: 2025
Страницы: 328–341
УДК: 811.512.141’322
Номер: Том 2, № 3
Тип: научная статья
DOI: https://doi.org/10.31833/sifk/2025.2.3.39
Рубрика: НАУЧНЫЕ КОЛЛЕКЦИИ И ФОНДЫ ИИЯЛ УФИЦ РАН
Авторы: Сиразитдинов Зиннур Амирович
В статье описываются структура и функциональные возможности Машинного фонда башкирского языка (далее – МФБЯ), разработанного в Институте истории, языка и литературы УФИЦ РАН. МФБЯ представляет собой интегрированную информационную систему поиска лингвистической информации с внутренними базами данных. Работа над фондом началась в 2006 г. На сегодня Машинный фонд состоит из 10 крупных разделов: генеральный словник, лексикографические, грамматические, экспериментально-фонетические базы, каталоги рукописных и старопечатных книг, диалектологическая база, корпусные базы из текстов прозаических, публицистических и фольклорных произведений башкирского языка. Общее количество баз лингвистических данных – 75 единиц. Информационная система МФБЯ разработана на основе системы управления базами данных ORACLE. Внесение лингвистических данных в реляционную базу предполагает осмысленную разбивку самих данных на элементарные составляющие, что позволяет эффективно и быстро извлекать агрегированные характеристики. МФБЯ имеет не только научное, но и большое практическое значение. Фонд является инструментом оптимизации и повышения качества дидактических материалов, в частности, при подготовке языковых примеров для учебников и учебных пособий. Министерство просвещения Республики Башкортостан активно пропагандирует Машинный фонд среди учителей башкирского языка. Использование МФБЯ редакторами, журналистами, переводчиками, несомненно, повышает их культуру владения башкирским языком. МФБЯ обладает значительной социальноэкономической эффективностью: функционирование в сети Интернет большого количества словарных и грамматических материалов снимает дорогостоящий процесс переиздания на бумажных носителях и дальнейшего их распространения; автоматический поиск по базам данных фонда ускоряет процесс поиска филологической информации, что приводит к ускорению самих процессов создания новых лингвистических разработок и дидактических материалов; доступность башкирского языкового материала в сети Интернет создает атмосферу удовлетворенности от проводимой в республике языковой и национальной политики.
башкирский язык, Машинный фонд башкирского языка, база данных, типы лингвистических баз данных, корпусная лингвистика, проекты корпусов башкирского языка, прикладная лингвистика
Андрющенко В.М., 1985. Машинный фонд русского языка: постановка задачи и практические шаги, Вопросы языкознания, № 2, с. 54–64.
Бочкарев В.В., 2019. Машинный фонд якутского языка, Электронная письменность народов российской федерации: опыт, проблемы и перспективы: Материалы II Международной научной конференции. Уфа, с. 59–61.
Булгаков Р.М., 2001. Каталог арабографичных книг Национального музея Республики Башкортостан. Уфа, 127 с.
Булгаков Р.М., 2002. Описание восточных рукописей Института истории, языка и литературы. Часть 1. Тюркские рукописи. Выпуск 1. Произведения XII–XVIII в. Уфа: Гилем, 128 с.
Бускунбаева Л.А., Сиразитдинов З.А., Ишмухаметова А.Ш., Ибрагимова А.Д., Мигранова Л.Г., 2012. Корпус текстов периодической печати на башкирском языке, Актуальные проблемы диалектологии языков народов России: Материалы ХII региональной конференции. Уфа: ИИЯЛ УФИЦ РАН, с. 139–141.
Бускунбаева Л.А., Сиразитдинов З.А., Ишмухаметова А.Ш., 2017. Состав и структура корпуса публицистики башкирского языка, Электронная письменность народов Российской Федерации: опыт, проблемы и перспективы: Материалы Междунар. науч. конф. Сыктывкар, с. 39–43.
Бускунбаева Л.А., Сиразитдинов З.А., 2020. Разработка аудиокорпуса восточного диалекта башкирского языка: проблемы и перспективы, Известия Уфимского научного центра РАН, № 2, с. 90–97.
Володина Н.И., 2008. Чувашская Республика, Многоязычие в России: региональные аспекты. М.: Межрегиональный центр библиотечного сотрудничества, с. 22–30.
Вторая Всесоюзная конференция по созданию МФ РЯ, 1988. Отв. ред. член-корр. АН СССР Ю.Н. Караулов, 230 с.
Галиуллин К.Р., Обносова Н.А., Тухватуллина А.А., Шарипзянова Л.С., 1994. Машинный фонд татарского языка: особенности формирования и функционирования, Проблемы лексикологии и терминологии татарского языка, вып. 2. Казань, с. 127–134.
Герд А.С., 1986. Русская морфология и машинный фонд русского языка, Вопросы языкознания, № 6, с. 90–96.
Диалектологический атлас башкирского языка, 2005. Уфа: Гилем, 243 с.
Есипова А.В., 1992. Создание машинного фонда шорского языка, Языки, духовная культура и история тюрков: традиции и современность: Труды международной конференции: В 3-х томах. Т. 1. Казань, с. 244–247.
Жубанов А.К., 2009. База данных «Тiл – қазына» казахского слова и её теоретические основы. Алматы: Арыс, 304 с. (на казах. яз.)
Жубанов А.Х., Ускомбаев С.А., 1988 г. О создании машинного фонда казахского языка, Материалы рабочего совещания «Машинные фонды языков народов СССР», Тбилиси, 13–22 ноября 1988 г., с. 16–17.
Машинные фонды языков народов СССР: материалы рабочего совещания (Таллин, 19–22 декабря 1988). Таллин: Инст. яз. и литературы АН ЭстССР, 1988. 21 с.
Надергулов М.Х., 2024. Башкирское литературоведение: прошлое, настоящее и будущее, Известия УФИЦ РАН. Серия: История. Филология. Культура, т. 1, № 1, с. 107–114.
Пиотровский Р.Г., Щерба А.М., Гузев В.Г., 1988. О создании машинного фонда тюркских языков, Советская тюркология, № 2, с. 92–101.
Сиразитдинов З.А., 2006. Моделирование грамматики башкирского языка. Словоизменительная система. Уфа: Гилем, 160 с.
Сиразитдинов З.А., 2013. О лемматизации в корпусах башкирского языка, Актуальные проблемы диалектологии языков народов России: Материалы XIII Междунар. конф. Уфа, с. 240–242.
Сиразитдинов З.А., 2014. О моделировании словоизменительной системы агглютинативных языков парными сочетаниями (на примере башкирского языка), Актуальные проблемы современного монголоведения и алтаистики. Материалы Междунар. науч. конф., посвященной 75-летию со дня рождения и 55-летию научно-педагогической деятельности профессора В.И. Рассадина. Элиста: Калмыцкий государственный университет, с. 139–143.
Сиразитдинов З.А., Бускунбаева Л.А., Ишмухаметова А.Ш., 2015. О лингвистических корпусах башкирского языка, Turkic Languages Processing: Turklang–2015. Proceedings of the International Conference, с. 269–276.
Сиразитдинов З.А., Бускунбаева Л.А., Ишмухаметова А.Ш., 2019. Об обработке звуковых материалов для диалектологического аудиокорпуса башкирского языка, Turkologia (Казахстан, Туркестан), № 4 (96), с. 35–45.
Сиразитдинов З.А., Бускунбаева Л.А., Ишмухаметова А.Ш., Ибрагимова А.Д., 2013. Информационные системы и базы данных башкирского языка. Уфа: Книжная палата РБ, 116 с.
Сиразитдинов З.А., Полянин А.И., 2014. Об опыте разработки интегрированной корпусной системы на базе СУБД ORACLE, Труды Казанской школы по компьютерной и когнитивной лингвистике. TEL– 2014, Казань: Фэн, с. 85–88.
Сиразитдинов З.А., Полянин А.И., Ибрагимова А.Д., Ишмухаметова А.Ш., 2013. Корпусы башкирского языка: принципы разработки, Проблемы востоковедения, № 4 (62), с. 65–72.
Хусаинова Г.Р., 2024. Башкирская фольклористика в системе современной гуманитарной науки (опыт собирания, издания, исследования), Известия УФИЦ РАН. Серия: История. Филология. Культура, т. 1, № 1, с. 89–96.
Шамсутдинова Г.Г., Ишмухаметова А.Ш., Бускунбаева Л.А., 2017. Структура и состав базы данных загадок в подкорпусе текстов афористических жанров башкирского фольклора, Вестник Калмыцкого института гуманитарных исследований РАН, т. 10, № 4 (32), с. 146–153.
Шевелев О.Г., 2004. Представление набора текстов в реляционной базе данных для целей лингвистического анализа, Вестник Томского государственного университета, № 284, с. 222–226.
The ARTFL Project: A textual database: сайт. URL: http://humanities.uchicago.edu/orgs/ ARTFL/artfl. flyer.html.