Показано с 1 по 30 из 87
Тема: Информационная полнота
-
31.05.2006, 17:01 #1
- Регистрация
- 31.05.2006
- Сообщений
- 2
Информационная полнота
Добрый день,
я интересуюсь темой определения условий полноты данных в информационных системах.Интересует именно то, как можно установить обладает ли система полными данными или нет. Может быть у кото-то есть соображения по этому поводу или есть ссылки на интересующий меня материал.Пишите.
Заранее Спасибо
-
06.06.2006, 11:33 #2
- Регистрация
- 13.12.2005
- Сообщений
- 105
Сообщение от Assa
-
06.06.2006, 13:56 #3
- Регистрация
- 24.11.2005
- Сообщений
- 3,432
Сообщение от Assa
То есть, полноты данных в нем не наблюдается.
Спрашивате конкретно, вам и ответят конкретно.
Это касается даже Яндекса.
-
06.06.2006, 18:17 #4
- Регистрация
- 31.05.2006
- Сообщений
- 2
Под полнотой информации(данных) я понимаю качество этих данных, которое бы определяло их достаточность для принятия решений или для создания новых данных на основе имеющихся
-
06.06.2006, 18:33 #5
- Регистрация
- 24.11.2005
- Сообщений
- 3,432
Сообщение от Assa
К качеству скорее относится достоверность данных. Разве не так?
Что касается достаточности данных для принятия решений, это неформальный параметр: одному человеку достаточно Х данных, а другому не хватит и 10Х.
Я под полнотой данных подразумеваю:
1. Степень покрытия данными анализируемых процессов.
2. Отсутствие пробелов в массивах данных.
3. Наличие временнх рядов достаточных для анализа.
Может быть есть что-то еще что забыл. Поправьте.
Напомню, что помимо полноты и достоверности, есть еще непротиворечивость.
-
06.06.2006, 21:45 #6
- Регистрация
- 03.12.2005
- Сообщений
- 177
Сообщение от Assa
1. Полнота по основанию.
Это применение квантора «все» к чему-либо: все из множества ..., все, такие, что...
Это понятие имеет прямое отношение к информационным системам, как подкласс ограничений целостности данных.
Например, есть оргструктура предприятия и она задана в некоторой ИС, но информационная система не проверяет полноту по оргединицам. В результате при построении оргструктуры пользователь может случайно забыть, и не включить все оргединицы, то есть получится не полная оргструктура, часть оргединиц останутся «висящими в воздухе».
Аналогично, к примеру, закрываете Вы бухгалтерский период, но в ИС хозяйственные операции совершаются отдельно, а проводки по ним проводятся отдельно, бухгалтером. Соответственно, если нет проверки на полноту учета хозяйственных операций, то может возникнуть ситуация, что не все операции будут проведены по бухгалтерии, то есть бухотчетность будет не полной.
Да миллион случаев такой не/полноты, куда не плюнь. Пример Болдина с процессами из той же серии.
О том нужна или не нужна какая-либо полнота – это дело предметной области, разработчиков, предприятия. Это всегда решение, не может быть таких априорных условий полноты.
2. В аналитических работах часто применяется «комбинаторная полнота», задающее пространство принятия решений, в том числе и при создании ИС.
Это такой выделенный частный случай предыдущего.
3. Формальная полнота применяется для анализа формальных систем. По простому говоря, обозначает «все, что выразимо, и все тексты, которые можно построить в данном языке». Ни одна из существующих ИС не является полной в этом смысле, так что можно и не рассматривать.
Но это тоже такой выделенный частный случай 1.
-
06.06.2006, 23:18 #7
- Регистрация
- 12.12.2005
- Сообщений
- 605
Сообщение от Assa
И потом, решения ведь могут приниматься не только на основе данных, но и на основе моделей (скажем, модели для оценки кредитоспособности). Естественно, модели базируются на данных, но не на Ваших -- разработчик собрал большой массив данных из многих источников, разработал модель и продал Вам результат...
Кроме того, возможна ситуация, когда Вы просто не знаете, какие данные важны для принятия конкретного решения, а какие нет.
Знаменитая Z-модель Альтмана, например, была получена методом дискриминационого анализа. В начале работы над моделью было сделано допущение о том, что значимыми могут быть 22 переменные. В ходе работы над моделью наименее значимые переменные исключались одна за другой, пока модель сохраняла предсказательную силу. В результате модель удалось "обрезать" до пяти переменных практически без потери предсказательной силы.
Пол Колльер из Всемирного банка с 1999 года опубликовал несколько исследований по статистике гражданских войн во второй половине XX века. До него считалось (без доказательств, в порядке аксиомы), что гражданские войны возникают там, где нет демократических свобод и существует значительное неравенство доходов. Проведенная Колльером логит-регрессия, однако, показала, что ни уровень демократических свобод, ни неравенство доходов не связаны с гражданской войной статистически значимо. Статистически значимо с гражданскими войнами связаны совсем другие факторы: значительный по отношению к ВВП экспорт сырья, наличие относительно зажиточной диаспоры, этническое доминирование (ситуация, когда крупнейшая этническая группа составляет 40-60% населения) и комбинация быстрого роста населения, стагнирующего или падающего душевого дохода и низкого процента мальчиков-подростков, посещающих школу.
-
16.06.2006, 14:47 #8
- Регистрация
- 12.12.2005
- Сообщений
- 72
Александр, Вы используете не менее абстрактные понятия, 'доcтаточность для принятия решения"
Практически невозможно сказать, что такое 100% покрытие данными анализируемого процесса, а следовательно нельзя сказать и о СТЕПЕНИ
А третий критерий просто говорит опять же о ДОСТАТОЧНОСТИ, которую Вы забраковали в самом начале.
Просто не существует само по себе понятие ОПИСАНИЕ ПРОЦЕССА. Есть описание с какой -то целью. Главное не само по себе описание, а цель. Поэтому сначало надо очень точно конкретизировать цель..придать ей количественно оцениваемый критерий продвижения к ее достижению. О потом уже включать в описание процесса все, что поможет нам приблизиться или достичь цели.
Обследование предприятий не имеет смысла, если у Вас нет такой цели..и критерия такого...
Более полное описание такое, которое содержит данные, без которых цель отдаляется (оценка приближения и отдаления провожится по критерию).
Если, к примеру, мы что-то выбросим из описания, а это мы не отдалились от цели, то следовательно полнота описания до выбрасывания и после остается одной и той же.. Это я к тому, что размер описания не совпадает с понятие полноты..
Сообщение от Александр Болдин
-
16.06.2006, 21:59 #9
- Регистрация
- 24.11.2005
- Сообщений
- 3,432
Сообщение от igor12345
Товар..2000..2001..2002..2003..2004..2005..2006
Сапоги...10....10.....50......80.....30.....10.....10
Туфли...20.....-...... 20.....30......-.......90....100
Тапки.....-......-.......-........-......18......21.....25
Кеды......-......-.......-........-.......-........-.......-
1. Степень покрытия данными анализируемых процессов = 70%.
Так как данных по продажам кедов нет (если бы продажи были нулевыми я бы написал "0"), этот набор просто не годится для статанализа.
А вот решение опытный менеджер принять может ... если например знает что "кеды" продаются так же как "туфли".
2. Отсутствие пробелов в массивах данных.
Есть пробелы по позиции "туфли", а это значит - точность анализа будет меньше, чем по позиции "сапоги". И это даже можно посчитать, только мне сейчас лень.
3. Наличие временных рядов достаточных для анализа.
По позиции "тапки" временной ряд недостаточен для анализа.
-
18.06.2006, 22:44 #10
- Регистрация
- 09.06.2006
- Сообщений
- 320
ПОЛНОТА И УРОВЕНТЬ ОПИСАНИЯ
Сообщение от Assa
-
20.06.2006, 14:19 #11
- Регистрация
- 20.06.2006
- Сообщений
- 20
Вопросами качества информации занимается группа в МИТ (Массачусетский технологический) под руководством Wang R. Давно и глубоко. Понятие полноты у них формально определено - это наличие соответствия между всеми возможными состояниями системы реального мира и состояниями информационной системы. У них есть определения и других характеристик качества. Все характеристики качества могут быть программно-ориентированными или информационно-ориентированными. В том числе и полнота зависит и от данных и от информационной системы. Полные етксты статей есть в wikepedia, одну статью я нашла в EBSCO.
-
20.06.2006, 22:09 #12
- Регистрация
- 24.11.2005
- Сообщений
- 3,432
Сообщение от Carina
Сообщение от Carina
Сообщение от Carina
-
21.06.2006, 03:58 #13
- Регистрация
- 20.06.2006
- Сообщений
- 20
To АБ. Так , кто же спорит - нафиг она нужна - бесконечность эта. Ее же все равно нельзя запрограммировать. Поэтому и читать про нее не стоит.
-
21.06.2006, 04:52 #14
- Регистрация
- 20.06.2006
- Сообщений
- 20
Сообщение от Александр Болдин
-
21.06.2006, 11:30 #15
- Регистрация
- 13.12.2005
- Сообщений
- 105
Добрый день!
Сообщение от Carina
Сообщение от Carina
Сообщение от Carina
К тому же паспортные данные - плохой пример, законодательство (по крайней мере, в России) меняют очень часто. И невозможно предусмотреть все возможные варианты.
-
21.06.2006, 11:59 #16
- Регистрация
- 09.06.2006
- Сообщений
- 320
Начинайте с предметной области. Тем и ищите авторитетов.
Сообщение от Carina
-
21.06.2006, 12:02 #17
- Регистрация
- 09.06.2006
- Сообщений
- 320
Начинайте с предметной области. Там и ищите авторитетов.
Сообщение от Carina
-
21.06.2006, 12:49 #18
- Регистрация
- 20.06.2006
- Сообщений
- 20
Сообщение от Nosenko
-
21.06.2006, 12:53 #19
- Регистрация
- 20.06.2006
- Сообщений
- 20
Сообщение от профессор элиович
-
21.06.2006, 13:51 #20
- Регистрация
- 09.06.2006
- Сообщений
- 320
Не хамите, деточка...
Сообщение от Carina
-
21.06.2006, 15:06 #21
- Регистрация
- 13.12.2005
- Сообщений
- 105
Сообщение от Carina
К сожалению, не видно в Вашем профиле, кто Вы: студент или работаете. Но хочу сказать, что это все в теории так красиво, а на практике совсем по-другому.
-
21.06.2006, 15:18 #22
- Регистрация
- 09.06.2006
- Сообщений
- 320
Полнота данных - это предел...
Полнота данных это предел, к которому можно стремиться. Отсюда и привлекаемые средства, включая методики и поддерживающие ресурсы.Такая концепция подхода к вопросу освободит вас от излишних интеллектуальных и финансовых издержек, непременно сопровождающих необходимость поиска решения.
-
21.06.2006, 16:02 #23
- Регистрация
- 20.06.2006
- Сообщений
- 20
Сообщение от Nosenko
-
21.06.2006, 22:18 #24
- Регистрация
- 24.11.2005
- Сообщений
- 3,432
Сообщение от Carina
Сообщение от Carina
В последнее время все чаще встречаю примеры такого "пунктирного мышления". Наверное тлетворное влияние телевизора...
PS. Если бы вы сами не обронили фразу "наступает момент, когда нужно изучать теорию, даже более того, нужно ее генерировать, так как ее обычно не хватает" ни за что не стал бы обращать ваше внимание. Но все так - прежде чем генерировать, надо бы сначала над собой поработать. Куда торопиться? Вся жизнь впереди...
-
21.06.2006, 22:29 #25
- Регистрация
- 24.11.2005
- Сообщений
- 3,432
Ищите смысл
Полнота данных это не предел и не двоичный параметр "полный\неполный". Если бы это было так, в этом не было бы никакого практического смысла.
Полнота данных - измеримый показатель, который характеризует точность расчетов проводимых на этих данных.
Понятно, что способы расчета показателя могут быть разными (в зависимости от специфики ИС), но суть от этого не меняется.
Нету здесь никакой эзотерики и все тут.
-
22.06.2006, 04:15 #26
- Регистрация
- 20.06.2006
- Сообщений
- 20
Сообщение от Александр Болдин
Сообщение от Александр Болдин
Давайте без эзотерики. В чем именно противоречие.
P.S. Кстати, один момент. Кажется, Вы занимаетесь BMPS ? Тогда мне странно, что Вы так пренебрежительно отнеслись к Wang и Weber , о статьях которых речь шла выше. Они написали, ставшей культовой статью по онтологиям информационных систем.
-
22.06.2006, 04:43 #27
- Регистрация
- 20.06.2006
- Сообщений
- 20
Сообщение от профессор элиович
-
22.06.2006, 10:02 #28
- Регистрация
- 09.06.2006
- Сообщений
- 320
забудем ...
Сообщение от Carina
По ходу внимательного изучения вашего мнения о тех, кто сталкивался с этой проблемой могу заметить, что ваш намек - неточен, мягко говоря.
О научной физкультуре- согласен, это не ерунда. Накачивать бицепсы знаний - труд, достойный уважения. Радикальная же моя реплика, простите - совсем о другом. О сравнительной полезности кладезя знаний предметной области и воздушных замков , где обитают, может быть, блестящие знания, но п о к а для нас - бесполезные, к сожалению.
Нашему поколению, начавшему трудную дорогу еще до войны, тоже, быть может, хотелось бы заняться этим, но пришла беда -а после того, как утихли пушки, начался звон лопат - мы восстанавливали разрушенные корпуса Харьковского авиационного института.Учились, голодные и обессиленные - вечером.Не повезло нам, просто- напросто.Может быть и мы занялись бы этим , но - не судьба.
Желаю вам успехов.Последний раз редактировалось профессор элиович; 22.06.2006 в 10:15.
-
22.06.2006, 11:45 #29
- Регистрация
- 20.06.2006
- Сообщений
- 20
Сообщение от профессор элиович
-
22.06.2006, 14:03 #30
- Регистрация
- 09.06.2006
- Сообщений
- 320
желаю успеха...
Прекрасные возможности и обнадеживающие перспективы безусловно прибавят вам оптимизма и несомненно приблизят к цели, чего от всей души - желаю.
Пусть успех следует за вами.