ISSN: 3034-2724 eISSN: 1111 - 1111 DOI: 10.31833/sifk

Известия УФИЦ РАН

Серия: История. Филология. Культура

Информационная система «Машинный фонд башкирского языка»

Год: 2025

Страницы: 328–341

УДК: 811.512.141’322

Номер: Том 2, № 3

Тип: научная статья

DOI: https://doi.org/10.31833/sifk/2025.2.3.39

Рубрика: НАУЧНЫЕ КОЛЛЕКЦИИ И ФОНДЫ ИИЯЛ УФИЦ РАН

Авторы: Сиразитдинов Зиннур Амирович

Аннотация:

В статье описываются структура и функциональные возможности Машинного фонда башкирского языка (далее – МФБЯ), разработанного в Институте истории, языка и литературы УФИЦ РАН. МФБЯ представляет собой интегрированную информационную систему поиска лингвистической информации с внутренними базами данных. Работа над фондом началась в 2006 г. На сегодня Машинный фонд состоит из 10 крупных разделов: генеральный словник, лексикографические, грамматические, экспериментально-фонетические базы, каталоги рукописных и старопечатных книг, диалектологическая база, корпусные базы из текстов прозаических, публицистических и фольклорных произведений башкирского языка. Общее количество баз лингвистических данных – 75 единиц. Информационная система МФБЯ разработана на основе системы управления базами данных ORACLE. Внесение лингвистических данных в реляционную базу предполагает осмысленную разбивку самих данных на элементарные составляющие, что позволяет эффективно и быстро извлекать агрегированные характеристики. МФБЯ имеет не только научное, но и большое практическое значение. Фонд является инструментом оптимизации и повышения качества дидактических материалов, в частности, при подготовке языковых примеров для учебников и учебных пособий. Министерство просвещения Республики Башкортостан активно пропагандирует Машинный фонд среди учителей башкирского языка. Использование МФБЯ редакторами, журналистами, переводчиками, несомненно, повышает их культуру владения башкирским языком. МФБЯ обладает значительной социально­экономической эффективностью: функционирование в сети Интернет большого количества словарных и грамматических материалов снимает дорогостоящий процесс переиздания на бумажных носителях и дальнейшего их распространения; автоматический поиск по базам данных фонда ускоряет процесс поиска филологической информации, что приводит к ускорению самих процессов создания новых лингвистических разработок и дидактических материалов; доступность башкирского языкового материала в сети Интернет создает атмосферу удовлетворенности от проводимой в республике языковой и национальной политики.

Ключевые слова:

башкирский язык, Машинный фонд башкирского языка, база данных, типы лингвистических баз данных, корпусная лингвистика, проекты корпусов башкирского языка, прикладная лингвистика

Библиографический список:

Андрющенко В.М., 1985. Машинный фонд русского языка: постановка задачи и практические шаги, Вопросы языкознания, № 2, с. 54–64.

Бочкарев В.В., 2019. Машинный фонд якутского языка, Электронная письменность народов российской федерации: опыт, проблемы и перспективы: Материалы II Международной научной конференции. Уфа, с. 59–61.

Булгаков Р.М., 2001. Каталог арабографичных книг Национального музея Республики Башкортостан. Уфа, 127 с.

Булгаков Р.М., 2002. Описание восточных рукописей Института истории, языка и литературы. Часть 1. Тюркские рукописи. Выпуск 1. Произведения XII–XVIII в. Уфа: Гилем, 128 с.

Бускунбаева Л.А., Сиразитдинов З.А., Ишмухаметова А.Ш., Ибрагимова А.Д., Мигранова Л.Г., 2012. Корпус текстов периодической печати на башкирском языке, Актуальные проблемы диалектологии языков народов России: Материалы ХII региональной конференции. Уфа: ИИЯЛ УФИЦ РАН, с. 139–141.

Бускунбаева Л.А., Сиразитдинов З.А., Ишмухаметова А.Ш., 2017. Состав и структура корпуса публицистики башкирского языка, Электронная письменность народов Российской Федерации: опыт, проблемы и перспективы: Материалы Междунар. науч. конф. Сыктывкар, с. 39–43.

Бускунбаева Л.А., Сиразитдинов З.А., 2020. Разработка аудиокорпуса восточного диалекта башкирского языка: проблемы и перспективы, Известия Уфимского научного центра РАН, № 2, с. 90–97.

Володина Н.И., 2008. Чувашская Республика, Многоязычие в России: региональные аспекты. М.: Межрегиональный центр библиотечного сотрудничества, с. 22–30.

Вторая Всесоюзная конференция по созданию МФ РЯ, 1988. Отв. ред. член-корр. АН СССР Ю.Н. Караулов, 230 с.

Галиуллин К.Р., Обносова Н.А., Тухватуллина А.А., Шарипзянова Л.С., 1994. Машинный фонд татарского языка: особенности формирования и функционирования, Проблемы лексикологии и терминологии татарского языка, вып. 2. Казань, с. 127–134.

Герд А.С., 1986. Русская морфология и машинный фонд русского языка, Вопросы языкознания, № 6, с. 90–96.

Диалектологический атлас башкирского языка, 2005. Уфа: Гилем, 243 с.

Есипова А.В., 1992. Создание машинного фонда шорского языка, Языки, духовная культура и история тюрков: традиции и современность: Труды международной конференции: В 3-х томах. Т. 1. Казань, с. 244–247.

Жубанов А.К., 2009. База данных «Тiл – қазына» казахского слова и её теоретические основы. Алматы: Арыс, 304 с. (на казах. яз.)

Жубанов А.Х., Ускомбаев С.А., 1988 г. О создании машинного фонда казахского языка, Материалы рабочего совещания «Машинные фонды языков народов СССР», Тбилиси, 13–22 ноября 1988 г., с. 16–17.

Машинные фонды языков народов СССР: материалы рабочего совещания (Таллин, 19–22 декабря 1988). Таллин: Инст. яз. и литературы АН ЭстССР, 1988. 21 с.

Надергулов М.Х., 2024. Башкирское литературоведение: прошлое, настоящее и будущее, Известия УФИЦ РАН. Серия: История. Филология. Культура, т. 1, № 1, с. 107–114.

Пиотровский Р.Г., Щерба А.М., Гузев В.Г., 1988. О создании машинного фонда тюркских языков, Советская тюркология, № 2, с. 92–101.

Сиразитдинов З.А., 2006. Моделирование грамматики башкирского языка. Словоизменительная система. Уфа: Гилем, 160 с.

Сиразитдинов З.А., 2013. О лемматизации в корпусах башкирского языка, Актуальные проблемы диалектологии языков народов России: Материалы XIII Междунар. конф. Уфа, с. 240–242.

Сиразитдинов З.А., 2014. О моделировании словоизменительной системы агглютинативных языков парными сочетаниями (на примере башкирского языка), Актуальные проблемы современного монголоведения и алтаистики. Материалы Междунар. науч. конф., посвященной 75-летию со дня рождения и 55-летию научно-педагогической деятельности профессора В.И. Рассадина. Элиста: Калмыцкий государственный университет, с. 139–143.

Сиразитдинов З.А., Бускунбаева Л.А., Ишмухаметова А.Ш., 2015. О лингвистических корпусах башкирского языка, Turkic Languages Processing: Turklang–2015. Proceedings of the International Conference, с. 269–276.

Сиразитдинов З.А., Бускунбаева Л.А., Ишмухаметова А.Ш., 2019. Об обработке звуковых материалов для диалектологического аудиокорпуса башкирского языка, Turkologia (Казахстан, Туркестан), № 4 (96), с. 35–45.

Сиразитдинов З.А., Бускунбаева Л.А., Ишмухаметова А.Ш., Ибрагимова А.Д., 2013. Информационные системы и базы данных башкирского языка. Уфа: Книжная палата РБ, 116 с.

Сиразитдинов З.А., Полянин А.И., 2014. Об опыте разработки интегрированной корпусной системы на базе СУБД ORACLE, Труды Казанской школы по компьютерной и когнитивной лингвистике. TEL– 2014, Казань: Фэн, с. 85–88.

Сиразитдинов З.А., Полянин А.И., Ибрагимова А.Д., Ишмухаметова А.Ш., 2013. Корпусы башкирского языка: принципы разработки, Проблемы востоковедения, № 4 (62), с. 65–72.

Хусаинова Г.Р., 2024. Башкирская фольклористика в системе современной гуманитарной науки (опыт собирания, издания, исследования), Известия УФИЦ РАН. Серия: История. Филология. Культура, т. 1, № 1, с. 89–96.

Шамсутдинова Г.Г., Ишмухаметова А.Ш., Бускунбаева Л.А., 2017. Структура и состав базы данных загадок в подкорпусе текстов афористических жанров башкирского фольклора, Вестник Калмыцкого института гуманитарных исследований РАН, т. 10, № 4 (32), с. 146–153.

Шевелев О.Г., 2004. Представление набора текстов в реляционной базе данных для целей лингвистического анализа, Вестник Томского государственного университета, № 284, с. 222–226.

The ARTFL Project: A textual database: сайт. URL: http://humanities.uchicago.edu/orgs/ ARTFL/artfl. flyer.html.

Скачать pdf
наверх
Поиск
ISSN: 3034-2724 eISSN: 1111 - 1111 DOI: 10.31833/sifk