Внешние данные и схема БД
Nov. 21st, 2016 09:52 pmСуществует известная дилемма, можно ли использовать данные предметной области для построения структуры отношений ( схемы) БД или это должны быть внутренние данные? Например, хорошо ли использовать номер паспорта1? Некоторые рассуждения могут показаться не очень понятными: внешние данные не контролируются системой, а значит, не контролируется и схема, её качество. Ну и что? Помимо прочего, написал для себя несколько кратких утверждений
1. Данные создаются вне ограничений и контроля.
2. Любые внешние данные могут содержать неустранимые ошибки, это вопрос вероятности.
3. Что означает, для внешних данных нельзя говорить об уникальности и других ограничениях.
4. Использование внешних данных в отображениях схемы означает создание некорректных отображений схемы.
Теперь предлагается практическая задача. Вы — разработчик банковской системы, операционист вводит данные клиента и здесь выясняется, что такой уникальный идентификационный документ в системе уже существует. Как такая ситуация должна обрабатываться в системе?
---
1. http://www.newsru.com/russia/13aug2015/bashpass.html
1. Данные создаются вне ограничений и контроля.
2. Любые внешние данные могут содержать неустранимые ошибки, это вопрос вероятности.
3. Что означает, для внешних данных нельзя говорить об уникальности и других ограничениях.
4. Использование внешних данных в отображениях схемы означает создание некорректных отображений схемы.
Теперь предлагается практическая задача. Вы — разработчик банковской системы, операционист вводит данные клиента и здесь выясняется, что такой уникальный идентификационный документ в системе уже существует. Как такая ситуация должна обрабатываться в системе?
---
1. http://www.newsru.com/russia/13aug2015/bashpass.html
no subject
Date: 2016-11-22 06:13 am (UTC)no subject
Date: 2016-11-22 11:42 pm (UTC)no subject
Date: 2016-11-23 05:30 am (UTC)У АСУшников, кстати, тоже интересный подход к этому - там идет куча оценок качества сигнала в зависимости от прибора и они поставляются отдельными пакетами в реальном времени, участвуя в управлении объектом автоматизации.
no subject
Date: 2016-11-23 07:50 pm (UTC)no subject
Date: 2016-11-22 06:18 am (UTC)no subject
Date: 2016-11-22 10:10 am (UTC)Лучше дату и место рождения- эта инфа легально не поменяется, пока не изобрели машину времени
no subject
Date: 2016-11-22 10:14 am (UTC)no subject
Date: 2016-11-22 10:23 am (UTC)Насколько я знаю, единственный документ, который в России не должен меняться - СНИЛС.
no subject
Date: 2016-11-22 07:00 pm (UTC)no subject
Date: 2016-11-22 11:45 pm (UTC)no subject
Date: 2016-11-22 11:45 pm (UTC)no subject
Date: 2016-11-22 11:44 pm (UTC)no subject
Date: 2016-11-23 12:43 am (UTC)no subject
Date: 2016-11-23 02:04 am (UTC)no subject
Date: 2016-11-23 02:15 am (UTC)Первое склеить - задача техническая, расклеить вторую - может оказаться задачей практически неразрешимой (после того как ссылки на нее протянутся много куда) - я в общем сочувствую тем банкам etc которые попали на башкирские дубликаты
no subject
Date: 2016-11-22 06:43 am (UTC)То же самое с емейлом, кстати. Если человек сообщает свой мейл, и у нас такой есть, что остается делать? Посылать ему сообщение на этот мейл.
А вот с SSN туго. Мы просто, не думая, объединяли информацию. Потому что это в этой стране однозначно идентифицирует человека. У нас, правда, это было связано только с аккаунтом. Ну и, главное, Фиделити идентифицирует человека по ССН. Смешно другое, что показывать ССН нигде нельзя.
И еще случай. Документов нет, а есть имя. Дэйв Смит. И у него сын Дэйв Смит. А даты рождения нету. Или еще был случай - один индус своих пятерых детей назвал одинаково. Ну и?
Сложно все.
Возвращаясь к банку - ну откроем еще аккаунт на этого человека. Банку-то не пофиг ли.
no subject
Date: 2016-11-22 07:53 am (UTC)PS: Впрочем несложное гугление показывает что:
San Diego firm ID Analytics has looked at 290 million social security numbers. They've found 40 million of them have more than one name attached to them.
...
More than 20 million Americans have more than one SSN associated with their name. (http://www.witn.com/home/headlines/Duplicate__111371029.html)
no subject
Date: 2016-11-22 09:04 am (UTC)no subject
Date: 2016-11-23 12:23 am (UTC)Во множестве целых чисел нет неверных элементов, да и в конечном множестве тоже, иначе это уже не совсем множество. А в данных ошибки могут быть. Данные, информация, это уже не элементы, это сигнал, который надо интерпретировать: отобразить на код или слово.
И если мы потом делаем какие-то отображения, произведения, то это уже не ошибки внешних данных, а наши результаты. И тут начинается первый закон органической химии. И многие вероятности велики.
no subject
Date: 2016-11-22 07:03 am (UTC)no subject
Date: 2016-11-22 07:55 am (UTC)no subject
Date: 2016-11-23 12:25 am (UTC)В общем случае источников ошибки вообще может быть весьма много.
no subject
Date: 2016-11-23 02:55 am (UTC)no subject
Date: 2016-11-23 03:40 am (UTC)no subject
Date: 2016-11-22 10:52 am (UTC)В остальном всё как обычно. Скорее всего это просто опечатка при вводе существующей записи.
no subject
Date: 2016-11-23 12:34 am (UTC)Но другой интересный вопрос: чем тем временем будет заниматься клиент банка? Предположу, что написанием поста в соцсетях, о том, что в этом банке не только не сделали необходимые ему операции, например не открыли счёт, но откуда-то знали его персональные данные и уже их с кем-то перепутали. И, наверное, такой пост станет популярным. И это правильно.
no subject
Date: 2016-11-23 11:05 am (UTC)Учимся читать комментарии.
СБ должна обратиться в органы, чтобы понять, что пошло не так. В фоновом режиме.