Хорошо.
Предложите свой алгоритм убирания дубликатов типа городской округ Новосибирск - Новосибирск, МЫСКОВСКИЙ ГОРОДСКОЙ ОКРУГ - Мыски с использованием admin_centre.
По сути, статус здесь это избыточная информация.
Грубо говоря, указание городского округа, да и муниципального района излишни для их административного центра.
Остальным писать как есть “Хххх район”, “Ууууу городской округ”.
Вторая часть вас, как я понимаю, и смущает, хотя это и отражает формальное положение вещей.
Только одно уточнение.
Статус считать избыточным, если названия городского округа совпадают с названием админ. центра, с учетом перехода существительного в прилагательное (пример: Мыски - МЫСКОВСКИЙ ГОРОДСКОЙ ОКРУГ)
Как вариант, можно для сокращенного названия использовать поле alt_name либо short_name либо какое-то другое.
Только как сейчас достать названия до последних изменений?