И ещё о тестировании
Apr. 5th, 2020 09:14 amКогда мы смотрим на статистику, например, на панели Университета Джонcа Хопкинса1, нам надо понимать довольно много сложностей.
Например, что мы видим не количество заражений, а количество положительных тестов, при существующей методике и возможностях тестирования. Методика будет разной и селективной. И это количество — зависимость от наличия и доступности тестов.
Например, сейчас нет данных тестирования для произвольной выборки, по которой можно было бы нормировать данные селективной выборки. Технически это было бы возможно — проверить случайную выборку из 1024 человек. Или на порядок больше. Проверить анонимно, выдав уникальные номерки, по которым люди сами смогли бы при желании проверить результаты на сайте. Не говоря уже о том, что полезной могла быть хотя бы информация об общем тестировании и его доступности. Это всё отличается от региона к региону.
Разной будут и другие методики данных, поэтому эти данные нельзя просто в лоб складывать и сопоставлять.
Например, когда мы смотрим на отдельную запись данных для King, WA, то количество выздоровевших будет 0.
В каждом месте свои методики и свои данные. Которые, тем не менее, как-то складываются в общую панель. Которые статистически всё же выравниваются. И эти данные можно использовать, но надо понимать как именно, где и какие тренды, корреляции могут быть правильными и в какой степени. Это, конечно, требует работы с данными — спуск до конечных данных и сопоставление с учётом методик и факторов.
Например, когда мы видим, что в WA, случаев мало, а смертность большая, то это может иметь разное значение. В том числе и значение фактора доступности тестов.
И например, когда мы смотрим на данные смертности, как наиболее точно определяемые, то сопоставлять их стоит с прошлыми данными по случаям.
И так далее и далее. Так что за простой панелью с тремя параметрами стоит достаточно сложный процесс.
---
1. https://coronavirus.jhu.edu/map.html
Например, что мы видим не количество заражений, а количество положительных тестов, при существующей методике и возможностях тестирования. Методика будет разной и селективной. И это количество — зависимость от наличия и доступности тестов.
Например, сейчас нет данных тестирования для произвольной выборки, по которой можно было бы нормировать данные селективной выборки. Технически это было бы возможно — проверить случайную выборку из 1024 человек. Или на порядок больше. Проверить анонимно, выдав уникальные номерки, по которым люди сами смогли бы при желании проверить результаты на сайте. Не говоря уже о том, что полезной могла быть хотя бы информация об общем тестировании и его доступности. Это всё отличается от региона к региону.
Разной будут и другие методики данных, поэтому эти данные нельзя просто в лоб складывать и сопоставлять.
Например, когда мы смотрим на отдельную запись данных для King, WA, то количество выздоровевших будет 0.
В каждом месте свои методики и свои данные. Которые, тем не менее, как-то складываются в общую панель. Которые статистически всё же выравниваются. И эти данные можно использовать, но надо понимать как именно, где и какие тренды, корреляции могут быть правильными и в какой степени. Это, конечно, требует работы с данными — спуск до конечных данных и сопоставление с учётом методик и факторов.
Например, когда мы видим, что в WA, случаев мало, а смертность большая, то это может иметь разное значение. В том числе и значение фактора доступности тестов.
И например, когда мы смотрим на данные смертности, как наиболее точно определяемые, то сопоставлять их стоит с прошлыми данными по случаям.
И так далее и далее. Так что за простой панелью с тремя параметрами стоит достаточно сложный процесс.
---
1. https://coronavirus.jhu.edu/map.html
no subject
Date: 2020-04-05 04:52 pm (UTC)