Показано с 1 по 25 из 25
  1. #1
    Новый участник
    Регистрация
    29.06.2006
    Сообщений
    2

    По умолчанию Как рассчитать доверительный интервал для прогнозного значения?

    В статье "Доработка алгоритма прогнозирования объема продаж" есть абзац: "Для учета ошибок воспользуемся доверительным интервалом модели, рассчитанным для прогнозных значений. Доверительный интервал отражает в каких пределах может колебаться ошибка прогнозных значений".
    Я не могу понять как при прогнозном значении линейной модели 8619,94 получают доверительный интервал - 8193,058 + 9046,82. Как получить данный значения, подскажите, пожалуйста.

  2. #2
    Член сообщества
    Регистрация
    10.03.2006
    Сообщений
    444

    По умолчанию

    Цитата Сообщение от Veranik
    Я не могу понять как при прогнозном значении линейной модели 8619,94 получают доверительный интервал - 8193,058 + 9046,82. Как получить данный значения, подскажите, пожалуйста.
    Надо знать распределение ошибки или, хотя бы, некоторые его параметры, кроме этого, нужно задаться допустимой вероятностью. Доверительный интервал - это интервал, в котором находится истинное значение с некоторой заданной вероятностью. Чем вероятность выше - тем шире интервал. Например, для очень часто встречающегося нормального распределения ошибки доверительный интврвал для вероятности 0,995 равен трем стандартным отклонениям в каждую сторону от среднего.

    Возможно, где-то в вашей статье рассчитывалось (оценивалось по опытным данным) стандартное отклонение или дисперсия, посмотрите.

  3. #3
    Новый участник
    Регистрация
    29.06.2006
    Сообщений
    2

    По умолчанию

    В том то и дело, что я не знаю как мне рассчитать ошибку прогнозного значения.
    Ведь чтобы рассчитать ошибку прогнозного значения, нужно найти разницу между фактом и значением линейной модели, но при прогнозе ведь факта нет. Не могу же я из прогнозного значения вычитать прогнозное. Если же я прогнозное значение умножаю на СКО=0,0019, то у меня получаются другие цифры, чем в статье.
    Мне известен линейный тренд (4185,9575), сезонная компонента (4433,981); прогнозное значение (8619,94); СКО (0,0019) и полученные результаты доверительно интервала: наим.8193,058, наиб. 9046,82. Но каким образом получились такие значения дов.интервала понять не могу. Может Вы поможете?

  4. #4

    По умолчанию

    Цитата Сообщение от Veranik
    В том то и дело, что я не знаю как мне рассчитать ошибку прогнозного значения.
    Ведь чтобы рассчитать ошибку прогнозного значения, нужно найти разницу между фактом и значением линейной модели, но при прогнозе ведь факта нет. Не могу же я из прогнозного значения вычитать прогнозное. Если же я прогнозное значение умножаю на СКО=0,0019, то у меня получаются другие цифры, чем в статье.
    Мне известен линейный тренд (4185,9575), сезонная компонента (4433,981); прогнозное значение (8619,94); СКО (0,0019) и полученные результаты доверительно интервала: наим.8193,058, наиб. 9046,82. Но каким образом получились такие значения дов.интервала понять не могу. Может Вы поможете?
    Чтобы разобраться почитайте хороший учебник по мат стату.

  5. #5
    Член сообщества
    Регистрация
    10.03.2006
    Сообщений
    444

    По умолчанию

    Цитата Сообщение от Veranik
    В том то и дело, что я не знаю как мне рассчитать ошибку прогнозного значения.
    Ведь чтобы рассчитать ошибку прогнозного значения, нужно найти разницу между фактом и значением линейной модели, но при прогнозе ведь факта нет. Не могу же я из прогнозного значения вычитать прогнозное. Если же я прогнозное значение умножаю на СКО=0,0019, то у меня получаются другие цифры, чем в статье.
    Мне известен линейный тренд (4185,9575), сезонная компонента (4433,981); прогнозное значение (8619,94); СКО (0,0019) и полученные результаты доверительно интервала: наим.8193,058, наиб. 9046,82. Но каким образом получились такие значения дов.интервала понять не могу. Может Вы поможете?
    Может, вы ссылку на статью дадите?

  6. #6
    Новый участник
    Регистрация
    09.07.2006
    Сообщений
    6

    По умолчанию

    Я также хотел бы узнать, каким образом получились такие значения доверительного интервала для прогноза (п.2.1, таблица 10). Если использовать значения, полученные в ходе анализа реального объема продаж - доверительный интервал получается меньше, чем указано в статье. Очень хотелось бы получить ответ, поскольку сейчас как раз разрабатывается программа по этому алгоритму и не получается закончить по выше указанной причине.

    Статья находится на этом сайте, вот ссылка: http://www.cfin.ru/finanalysis/math/add_to_kosh.shtml

  7. #7

    По умолчанию

    Цитата Сообщение от ThinkerX
    Я также хотел бы узнать, каким образом получились такие значения доверительного интервала для прогноза (п.2.1, таблица 10). Если использовать значения, полученные в ходе анализа реального объема продаж - доверительный интервал получается меньше, чем указано в статье. Очень хотелось бы получить ответ, поскольку сейчас как раз разрабатывается программа по этому алгоритму и не получается закончить по выше указанной причине.

    Статья находится на этом сайте, вот ссылка: http://www.cfin.ru/finanalysis/math/add_to_kosh.shtml
    А вы поняли, как он СКО считает.
    Вообще статья странная. Например, коэффициент наклона линейной регресси статистически не значим, как и само уравнение, но автора это мало заботит.
    И еще один момент - используя 24 значения строится модель с 14 объясняющими переменными - считать при этом доверительные интервалы просто смешно.
    Последний раз редактировалось WLMike; 10.07.2006 в 12:33.

  8. #8
    Новый участник
    Регистрация
    09.07.2006
    Сообщений
    6

    По умолчанию

    Вообще статья странная.
    А что вы думаете по поводу статьи Кошечкина, в ответ на которую написана данная статья?

    Если эти материалы - бред, какой алгоритм тогда лучше использовать для написания программы прогноза объема продаж? Речь идет о небольшом по возможностям ПО (без Excel) для использования внутри предприятия. Абсолютная точность не нужна, достаточно, как говорится, "плюс-минус..."

  9. #9

    По умолчанию

    Цитата Сообщение от ThinkerX
    А что вы думаете по поводу статьи Кошечкина, в ответ на которую написана данная статья?

    Если эти материалы - бред, какой алгоритм тогда лучше использовать для написания программы прогноза объема продаж? Речь идет о небольшом по возможностям ПО (без Excel) для использования внутри предприятия. Абсолютная точность не нужна, достаточно, как говорится, "плюс-минус..."
    А дайте ссылочку на статью?

    Не то что эти материалы бред - просто в них присутствует идея наукообразности, которой мне кажется на самом деле нет. Если эта методика работает для ваших целей, а это вы легко можте проверить, используйти ее, но при этом не надо говорить про коэффициенты детерминаци и доверительные интервалы и прочие статистические показатели, тут как раз бред и начинается.

  10. #10
    Новый участник
    Регистрация
    09.07.2006
    Сообщений
    6

    По умолчанию

    Статья находится в том же разделе, вот ссылка: http://www.cfin.ru/finanalysis/sales_forecast.shtml

  11. #11

    По умолчанию

    Статья мало отличается от другой и, на мой взгляд, тоже неудачная – автор достаточно слабо ориентируется в статистике. Например, он пишет: «Определяется тренд, наилучшим образом аппроксимирующий фактические данные. Существенным моментом при этом является предложение использовать полиномиальный тренд, что позволяет сократить ошибку прогнозной модели.» Полиномиальный тренд с точки зрения статистики не всегда увеличивает точность прогноза, так как сложно добиться статистической значимости коэффициентов при членах высокой степени. Так в примере из статьи, которую вы дали почитать первой, в уравнении даже линейной регрессии доверительный интервал для коэффициента наклона с вероятность 95%, который равен 2,04, составляет от -143,3 до 147,3. То есть степень его определенности, грубо говоря, никакая.
    Рассуждения автора про то, что высокий коэффициент детерминации это всегда хорошо, не верны.
    Расчет среднеквадратичной ошибки – ноу хао автора и имеет мало общего с тем, как это должно считаться. Плюс к этому, даже если ее посчитать правильно, она будет не показательна.
    Как сделать правильно:
    1. Накопить статистику лет за десять, тогда у вас 120 испытаний и модель с 14 объясняющими показателями. Такая модель будет хоть в какой-то степени адекватна с точки зрения статистики, хотя это не факт и нужен статистический анализ.
    2. Сократить количество объясняющих переменных, например вместо 12 переменных описывающих цикл ввести одну и описать цикл функцией синус. У вас будет ряд из 24 испытаний и модель с 3 объясняющими показателями. Комментарии по поводу первого подхода сохраняются, то есть вы должны хорошо знать статистику.
    3. Наиболее реальный. Вы берете статистику за 4 года. На основе первых двух лет строите модель, и проверяете отклонение по факту третьего года. Потом строите модель на базе второго и третьего года и проверяете отклонение на базе 4 года. Потом строите прогноз на базе 3 и 4 года и используете в своей практике прогнозирования. Грубо ошибку прогноза с вероятность 95% можно оценить по следующей формуле среднее квадратичное отклонение, умноженное на 2. Подход прост и требует мало знаний. Соотносится с тем, как вы будете действовать на практике. У вас будет 24 хороших с точки зрения статистики испытания.

  12. #12
    Новый участник
    Регистрация
    09.07.2006
    Сообщений
    6

    По умолчанию

    Ответ, достойный специалиста... Если позволите, есть встречный вопрос: может ли сработать предлагаемый подход для периодов, меньших чем год? Скажем, вместо года - неделя, месяц?

  13. #13

    По умолчанию

    Цитата Сообщение от ThinkerX
    Ответ, достойный специалиста... Если позволите, есть встречный вопрос: может ли сработать предлагаемый подход для периодов, меньших чем год? Скажем, вместо года - неделя, месяц?
    Я в этой области небольшой специалист - мне как и безвестным авторам статей верить до конца нельзя
    Отвечая на ваш вопрос с позиции своих несовершенных знаний скажу так: принципиально можно. Но вы должны провести тест, как я сказал: модель на одних данных, а тест на следующих за ними. Проверок желательно должно быть несколько десятков хотя бы. Оценить среднюю квадратичную ошибку. Умножить ее на 1 для вероятности прогноза 60%, на 2 для 95% и 3 для 99%. И решить устраивает ли вас такая ошибка? Если да, то все замечательно, если нет, то искать другую модель.

  14. #14
    Новый участник
    Регистрация
    09.07.2006
    Сообщений
    6

    По умолчанию

    Расчет среднеквадратичной ошибки – ноу хао автора и имеет мало общего с тем, как это должно считаться.
    А не подскажите как правильно? Кстати, принципиально ли это, ведь величина СКО достаточно мала...

  15. #15

    По умолчанию

    Цитата Сообщение от ThinkerX
    А не подскажите как правильно?
    Среднее квадратичное отклонение - это квадратный корень((сумма квадратов отклонения)/(количество испытаний - 1)).

    Цитата Сообщение от ThinkerX
    Кстати, принципиально ли это, ведь величина СКО достаточно мала...
    В каком-то смысле не принципиально, так как вся статья неверная. Но если считать верно, то именно для моего опредления отклонения есть определенные законы статистики, которые говорят, что если ошибка нормальная, то оценка величины лежит в предела средня +/-среднее квадратичное отклонение*t. Где t табличный коэффициент Стьюдента, для вероятности 60% он примерно 1, для вероятности 95% примерно 2, и 3 для вероятности 99%.

  16. #16
    Член сообщества
    Регистрация
    10.03.2006
    Сообщений
    444

    По умолчанию

    Цитата Сообщение от ThinkerX
    Статья находится в том же разделе, вот ссылка: http://www.cfin.ru/finanalysis/sales_forecast.shtml
    Автора статейки уже уличили в невежестве, я же думаю, что его стоит уличить и в подлоге. Коэффициент корреляции так называемой "информации об объёмах сбыта мороженого “Пломбир” одной из фирм в Нижнем Новгороде" за первый и за второй год точно равен единице. Не 0,9999999999999 или еще несколько девяток, а 1 ровно. Для сравнения, внеся в данные, например, случайную помеху в 1%, и найдя корреляцию с невозмущенными значениями, мы получим коэффициент корреляции менее 0,99999. Несомненно, никакого отношения к реальным данным по сбыту это иметь не может. В действительности, "данные за второй год" получены простым умножением на 1,1. Автор даже не стал пытаться замаскировать свой обман.

    Данные за первый год также явно фальшивые. Не говоря уже о том, что цена приведена с точностью до копейки (интересная цена для мороженого), а в июне - аж до долей копейки (ржунимагу), даже если поверить, что кто-то может устанавливать подобные цены (исключая июнь), установить такую цену, чтобы получить объемы продаж, приведенные аффтором, невозможно - большинство чисел - объемов продаж в копейках взаимно простые - не имеют общего делителя, иначе говоря, если они и продавались по одной цене, то исключительно за 1 копейку
    Последний раз редактировалось SKatkovsky; 11.07.2006 в 20:39.

  17. #17
    Новый участник
    Регистрация
    09.07.2006
    Сообщений
    6

    По умолчанию

    Любопытно... Две статьи с сайта - и обе "пальцем в небо"...

  18. #18

    По умолчанию

    На мой взгляд, не страшно, что данные не реальные. Не реальные данные могут наоборот помочь показать какой-нибудь тонкий момент. Плохо то, что статья безграмотная по сути, а ее многие читают и используют.

  19. #19
    Член сообщества
    Регистрация
    10.03.2006
    Сообщений
    444

    По умолчанию

    Цитата Сообщение от WLMike
    На мой взгляд, не страшно, что данные не реальные. Не реальные данные могут наоборот помочь показать какой-нибудь тонкий момент.
    В данном случае это важно. Ведь автор не чисто учебный материал подает, а пытаеться обосновать свой метод. Использовать же для обоснования подложные данные - ...

  20. #20

    По умолчанию

    Цитата Сообщение от SKatkovsky
    В данном случае это важно. Ведь автор не чисто учебный материал подает, а пытаеться обосновать свой метод. Использовать же для обоснования подложные данные - ...
    Каждый видит свое. Я, например, не вижу обоснования метода, а только его изложение.

  21. #21
    Член сообщества
    Регистрация
    10.03.2006
    Сообщений
    444

    По умолчанию

    Цитата Сообщение от WLMike
    Каждый видит свое. Я, например, не вижу обоснования метода, а только его изложение.
    Думаю, что даже если использовать искусственные данные исключительно в мирных целях , об этом как минимум необходимо сказать. Написанное же автором "информация об объёмах сбыта мороженого “Пломбир” одной из фирм в Нижнем Новгороде" является заведомой ложью незвисимо от того, обоснование это или изложение.

  22. #22

    По умолчанию

    Цитата Сообщение от SKatkovsky
    Думаю, что даже если использовать искусственные данные исключительно в мирных целях , об этом как минимум необходимо сказать. Написанное же автором "информация об объёмах сбыта мороженого “Пломбир” одной из фирм в Нижнем Новгороде" является заведомой ложью незвисимо от того, обоснование это или изложение.
    Тут вы правы, и наверное ложь сознательная. Этакая замануха, для тех кто сильно не разбирается, - смотрите как моя модель все объясняет. Хотя меня лично, цифры тут волновали меньше всего, ибо сам подход ущербен, и подлог данных я и не заметил.

  23. #23
    Член сообщества
    Регистрация
    10.03.2006
    Сообщений
    444

    По умолчанию

    Цитата Сообщение от WLMike
    Тут вы правы, и наверное ложь сознательная. Этакая замануха, для тех кто сильно не разбирается, - смотрите как моя модель все объясняет. Хотя меня лично, цифры тут волновали меньше всего, ибо сам подход ущербен, и подлог данных я и не заметил.
    Мне просто сразу бросилось в глаза удивительное совпадение формы кривой в первый и второй год, и я решил проверить свою догадку

  24. #24

    По умолчанию

    Цитата Сообщение от SKatkovsky
    Мне просто сразу бросилось в глаза удивительное совпадение формы кривой в первый и второй год, и я решил проверить свою догадку
    На сколько разные люди - у нас один собственик не любит графиков, только таблицы, я, когда его еще не знал, тоже графики не любил

  25. #25
    Новый участник
    Регистрация
    26.09.2011
    Сообщений
    1

    По умолчанию

    Скажите, пожалуйста, как расчитывать доверительный интервал, если ошибка прогноза мин.-10,6 а макс. 15 и что такое Анализ ошибок проноза, расчет и график распределения частоты ошибки

Ваши права

  • Вы не можете создавать новые темы
  • Вы не можете отвечать в темах
  • Вы не можете прикреплять вложения
  • Вы не можете редактировать свои сообщения
  •