Garbage in

Aug. 13th, 2015 05:49 pm
[personal profile] bowhill
В так называемых СМИ часто попадаются любопытные курьёзы на темы некорректных данных. С чудными адресами, отчествами и прочее. Сегодня прочитал о священной корове многих разработчиков – номерах паспортов. Сообщают,1 что в своё время выдали 50 тысяч (sic!) задвоенных паспортов, из них до сих пор обращается около 10 тысяч! И ничего.

Это просто повод ещё раз сказать о том, что любые данные, не созданные в рамках нашей собственной БД (системы) для нас не являются целостными, уникальными, достоверными, неизменными и далее все прочие полезные эпитеты. Не то, чтобы это был совершеннейший мусор, но скорее какие-то наскальные рисунки или записки нетрезвой обезьяны. И никакой внешний уровень режимности, особости, международности и т.д. тут роли не играет – мы эти данные не контролируем и судить об их качестве изначально не можем.

Тут подразумевается, что про свои данные мы понимаем, что они могут быть ошибочными и как-то это контролируем. Если же нет – это ещё одна серьёзная проблема разработчиков БД. Речь в первую очередь о данных, с которыми работают пользователи. Хотя ошибки бывают и в служебных данных и метаданных, но это уже, конечно, другой уровень реакции и решений.

И для своих данных хорошо понимать, что ограничения и проверки не устраняют проблемы и ошибки, а только уменьшают риски, вероятности. А так как системы большие и данных много – даже маленькие вероятности тоже становятся большими.

Также хотелось бы напомнить ещё об одном ошибочном принципе, по которому ранее введённые данные считаются более корректными. И хотя названная в таком виде эта ошибочность вызывает меньше вопросов, но в реализациях этот принцип встречается повсеместно.

И если приходится смотреть на чужую систему, то можно посмотреть на то, как система реагирует на данные, не соответствующие ограничениям и неявным допускам прикладных процессов и схем данных. Это один из простых и полезных способов анализа. Представьте, что будет делать оператор, когда перед ним стоит человек со своими корректными данными, а система просто не работает из своих соображений. Тут можно увидеть много проблем в головах у разработчиков.

---
1. http://www.newsru.com/russia/13aug2015/bashpass.html
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

Profile

Max Mikheenkov

December 2025

S M T W T F S
 1234 56
78910 1112 13
14151617181920
21 22 2324252627
28293031   

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 7th, 2026 07:43 am
Powered by Dreamwidth Studios