Графические методы анализа временных рядов. Методы анализа временных рядов Временной ряд и его основные элементы

Цели анализа временных рядов. При практическом изучении временных радов на основании экономических данных на определенном промежутке времени эконометрист должен сделать выводы о свойствах этого ряда и о вероятностном механизме, порождающем этот ряд. Чаще всего при изучении временных рядов ставятся следующие цели:

1. Краткое (сжатое) описание характерных особенностей ряда.

2. Подбор статистической модели, описывающей временной ряд.

3. Предсказание будущих значений на основе прошлых наблюдений.

4. Управление процессом, порождающим временной ряд.

На практике эти и подобные цели достижимы далеко не всегда и далеко не в полной мере. Часто этому препятствует недостаточный объем наблюдений из-за ограниченного времени наблюдений. Еще чаще – изменяющаяся с течением времени статистическая структура временного ряда.

Стадии анализа временных рядов. Обычно при практическом анализе временных рядов последовательно проходят следующие этапы:

1. Графическое представление и описание поведения временного рада.

2. Выделение и удаление закономерных составляющих временного рада, зависящих от времени: тренда, сезонных и циклических составляющих.

3. Выделение и удаление низко- или высокочастотных составляющих процесса (фильтрация).

4. Исследование случайной составляющей временного ряда, оставшейся после удаления перечисленных выше составляющих.

5. Построение (подбор) математической модели для описания случайной составляющей и проверка ее адекватности.

6. Прогнозирование будущего развития процесса, представленного временным рядом.

7. Исследование взаимодействий между различными временными радами.

Для решения этих задач существует большое количество различных методов. Из них наиболее распространенными являются следующие:

8. Корреляционный анализ, позволяющий выявить существенные периодические зависимости и их лаги (задержки) внутри одного процесса (автокорреляция) или между несколькими процессами (кросскорреляция).

9. Спектральный анализ, позволяющий находить периодические и квазипериодические составляющие временного ряда.

10. Сглаживание и фильтрация, предназначенные для преобразования временных рядов с целью удаления из них высокочастотных или сезонных колебаний.

12. Прогнозирование, позволяющее на основе подобранной модели поведения временного рада предсказывать его значения в будущем.

Модели тренда

простейшие модели тренда. Приведем модели трендов, наиболее часто используемые при анализе экономических временных рядов, а также во многих других областях. Во-первых, это простая линейная модель

где а 0 , а 1 – коэффициенты модели тренда;

t – время.

В качестве единицы времени, может быть, час, день (сутки), неделя, месяц, квартал или год. Модель 269, несмотря на свою простоту, оказывается полезной во многих реальных задачах. Если нелинейный характер тренда очевиден, то может подойти одна из следующих моделей:

1. Полиномиальная:

(270)

где значение степени полинома п в практических задачах редко превышает 5;

2. Логарифмическая:

Эта модель чаще всего применяется для данных, имеющих тенденцию сохранять постоянные темпы прироста;

3. Логистическая:

(272)

4. Гомперца

(273), где

Две последние модели задают кривые тренда S-образной формы. Они соответствуют процессам с постепенно возрастающими темпами роста в начальной стадии и постепенно затухающимитемпами роста в конце. Необходимость подобных моделей обусловлена невозможностью многих экономических процессов продолжительное время развиваться с постоянными темпами роста или по полиномиальным моделям, в связи с их довольно быстрым ростом (или уменьшением).

При прогнозировании тренд используют в первую очередь для долговременных прогнозов. Точность краткосрочных прогнозов, основанных только на подобранной кривой тренда, как правило, недостаточна.

Для оценки и удаления трендов из временных рядов чаще всего используется метод наименьших квадратов. Этот метод достаточно подробно рассматривался во втором разделе пособия в задачах линейного регрессионного анализа. Значения временного ряда рассматриваюткак отклик (зависимую переменную), а время t – какфактор, влияющий на отклик (независимую переменную).

Для временных рядов характерна взаимная зависимость его членов (по крайней мере, не далеко отстоящих по времени) и это является существенным отличием от обычного регрессионного анализа, для которого все наблюдения предполагаются независимыми. Тем не менее, оценки тренда и в этих условиях обычно оказываются разумными, если выбрана адекватная модель тренда и если среди наблюдений нет больших выбросов. Упомянутые выше нарушения ограничений регрессионного анализа сказываются не столько на значениях оценок, сколько наих статистических свойствах. Так, при наличии заметной зависимости между членами временного ряда оценки дисперсии, основанные на остаточнойсумме квадратов, дают неправильные результаты. Неправильными оказываются и доверительные интервалы для коэффициентов модели, и т.д. В лучшем случае их можно рассматривать как очень приближенные.

Цель анализа временных рядов обычно заключается в построении математической модели ряда, с помощью которой можно объяснить его поведение и осуществить прогноз на определенный период времени. Анализ временных рядов включает следующие основные этапы.

Анализ временного ряда обычно начинается с построения и изучения его графика.

Если нестационарность временного ряда очевидна, то первым делом надо выделить и удалить нестационарную составляющую ряда. Процесс удаления тренда и других компонент ряда, приводящих к нарушению стационарности, может проходить в несколько этапов. На каждом из них рассматривается ряд остатков, полученный в результате вычитания из исходного ряда подобранной модели тренда, или результат разностных и других преобразований ряда. Кроме графиков, признаками нестационарности временного ряда могут служить не стремящаяся к нулю автокорреляционная функция (за исключением очень больших значений лагов).

Подбор модели для временного ряда. После того, как исходный процесс максимально приближен к стационарному, можно приступить к подбору различных моделей полученного процесса. Цель этого этапа – описание и учет в дальнейшем анализе корреляционной структуры рассматриваемого процесса. При этом на практике чаще всего используются параметрические модели авторегрессии-скользящего среднего (ARIMA-модели)

Модель может считаться подобранной, если остаточная компонента ряда является процессом типа «белого шума», когда остатки распределены по нормальному закону с выборочным средним равным 0. После подбора модели обычно выполняются:

    оценка дисперсии остатков, которая в дальнейшем может быть использована для построения доверительных интервалов прогноза;

    анализ остатков с целью проверки адекватности модели.

Прогнозирование и интерполяция . Последним этапом анализа временного ряда может быть прогнозирование его будущих (экстраполяция) или восстановление пропущенных (интерполяция) значений и указания точности этого прогноза на базе подобранной модели. Не всегда удается хорошо подобрать математическую модель для временного ряда. Неоднозначность подбора модели может наблюдаться как на этапе выделения детерминированной компоненты ряда, так и при выборе структуры ряда остатков. Поэтому исследователи довольно часто прибегают к методу нескольких прогнозов, сделанных с помощью разных моделей.

Методы анализа. При анализе временных рядов обычно используются следующие методы:

    графические методы представления временных рядов и их сопутствующих числовых характеристик;

    методы сведения к стационарным процессам: удаление тренда, модели скользящего среднего и авторегрессии;

    методы исследования внутренних связей между элементами временных рядов.

3.5. Графические методы анализа временных рядов

Зачем нужны графические методы. В выборочных исследованиях простейшие числовые характеристики описательной статистики (среднее, медиана, дисперсия, стандартное отклонение) обычно дают достаточно информативное представление о выборке. Графические методы представления и анализа выборок при этом играют лишь вспомогательную роль, позволяя лучше понять локализацию и концентрацию данных, их закон распределения.

Роль графических методов при анализе временных рядов совершенно иная. Дело в том, что табличное представление временного ряда и описательные статистики чаще всего не позволяют понять характер процесса, в то время как по графику временного ряда можно сделать довольно много выводов. В дальнейшем они могут быть проверены и уточнены с помощью расчетов.

При анализе графиков можно достаточно уверенно определить:

    наличие тренда и его характер;

    наличие сезонных и циклических компонент;

    степень плавности или прерывистости изменений последовательных значений ряда после устранения тренда. По этому показателю можно судить о характере и величине корреляции между соседними элементами ряда.

Построение и изучение графика. Построение графика временного ряда – совсем не такая простая задача, как это кажется на первый взгляд. Современный уровень анализа временных рядов предполагает использование той или иной компьютерной программы для построения их графиков и всего последующего анализа. Большинство статистических пакетов и электронных таблиц снабжено теми или иными методами настройки на оптимальное представление временного ряда, но даже при их использовании могут возникать различные проблемы, например:

    из-за ограниченности разрешающей способности экранов компьютеров размеры выводимых графиков могут быть также ограничены;

    при больших объемах анализируемых рядов точки на экране, изображающие наблюдения временного ряда, могут превратиться в сплошную черную полосу.

Для борьбы с этими затруднениями используются различные способы. Наличие в графической процедуре режима «лупы» или «увеличения» позволяет изобразить более крупно выбранную часть ряда, однако при этом становится трудно судить о характере поведения ряда на всем анализируемом интервале. Приходится распечатывать графики для отдельных частей ряда и состыковыватьих вместе, чтобы увидеть картину поведения ряда в целом. Иногда для улучшения воспроизведения длинных рядов используетсяпрореживание, то есть выбор и отображение на графике каждой второй, пятой, десятой и т.д. точки временного ряда. Эта процедура позволяет сохранить целостное представление ряда и полезна для обнаружения трендов. На практике полезно сочетание обеих процедур: разбиения ряда на части и прореживания, так как они позволяют определить особенности поведения временного ряда.

Еще одну проблему при воспроизведении графиков создают выбросы – наблюдения, в несколько раз превышающие по величине большинство остальных значений ряда. Их присутствие тоже приводит к неразличимости колебаний временного ряда, так как масштаб изображения программа автоматически подбирает так, чтобы все наблюдения поместились на экране. Выбор другого масштаба на оси ординат устраняет эту проблему, но резко отличающиеся наблюдения при этом остаются за границами экрана.

Вспомогательные графики. При анализе временных рядов часто используются вспомогательные графики для числовых характеристик ряда:

    график выборочной автокорреляционной функции (коррелограммы) с доверительной зоной (трубкой) для нулевой автокорреляционной функции;

    график выборочной частной автокорреляционной функции с доверительной зоной для нулевой частной автокорреляционной функции;

    график периодограммы.

Первые дваиз этих графиков позволяют судить о связи (зависимости) соседних значений временного рада, они используются при подборе параметрических моделей авторегрессии и скользящего среднего. График периодограммы позволяет судить о наличии гармонических составляющих во временном ряде.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Федеральное агентство по образованию

Волгоградский государственный технический университет

КОНТРОЛЬНАЯ РАБОТА

по дисциплине: М одели и методы в экономике

на тему «Анализ временных рядов»

Выполнил: студентка группы ЭЗБ 291с Селиванова О. В.

Волгоград 2010г.

Введение

Классификация временных рядов

Методы анализа временных рядов

Заключение

Литература

Введение

Исследование динамики социально-экономических явлений, выявление и характеристика основных тенденций развития и моделей взаимосвязи дает основание для прогнозирования, то есть определения будущих размеров экономического явления.

Особенно актуальными становятся вопросы прогнозирования в условиях перехода на международные системы и методики учета и анализа социально-экономических явлений.

Важное место в системе учета занимают статистические методы. Применение и использование прогнозирования предполагает, что закономерность развития, действующая в прошлом, сохраняется и прогнозируемом будущем.

Таким образом, изучение методов анализа качества прогнозов является сегодня очень актуальным. Именно эта тема выбрана в качестве объекта исследования в данной работе.

Временной ряд -- это упорядоченная по времени последовательность значений некоторой произвольной переменной величины. Каждое отдельное значение данной переменной называется отсчётом временного ряда. Тем самым, временной ряд существенным образом отличается от простой выборки данных.

Классификация временных рядов

Временные ряды классифицируются по следующим признакам.

1. По форме представления уровней:

Ш ряды абсолютных показателей;

Ш относительных показателей;

Ш средних величин.

2. По характеру временного параметра:

Ш моментные. В моментных временных рядах уровни характеризуют значения показателя по состоянию на определенные моменты времени. В интервальных рядах уровни характеризуют значение показателя за определенные периоды времени.

Ш интервальные временные ряды. Важная особенность интервальных временных рядов абсолютных величин заключается в возможности суммирования их уровней.

3. По расстоянию между датами и интервалами времени:

Ш полные (равноотстоящие) - когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами.

Ш неполные (не равноотстоящие) - когда принцип равных интервалов не соблюдается.

4. В зависимости от наличия основной тенденции:

Ш стационарные ряды - в которых среднее значение и дисперсия постоянны.

Ш нестационарные - содержащие основную тенденцию развития.

Методы анализа временных рядов

Временные ряды исследуются с различными целями. В одном ряде случаях бывает достаточно получить описание характерных особенностей ряда, а в другом ряде случаев требуется не только предсказывать будущие значения временного ряда, но и управлять его поведением. Метод анализа временного ряда определяется, с одной стороны, целями анализа, а с другой стороны, вероятностной природой формирования его значений.

Методы анализа временных рядов.

1. Спектральный анализ. Позволяет находить периодические составляющие временного ряда.

2. Корреляционный анализ. Позволяет находить существенные периодические зависимости и соответствующие им задержки (лаги) как внутри одного ряда (автокорреляция), так и между несколькими рядами. (кросскорреляция)

3. Сезонная модель Бокса-Дженкинса. Применяется когда временной ряд содержит явно выраженный линейный тренд и сезонные составляющие. Позволяет предсказывать будущие значения ряда. Модель была предложена в связи с анализом авиаперевозок.

4. Прогноз экспоненциально взвешенным скользящим средним. Простейшая модель прогнозирования временного ряда. Применима во многих случаях. В том числе, охватывает модель ценообразования на основе случайных блужданий.

Цель спектрального анализа - разложить ряд на функции синусов и косинусов различных частот, для определения тех, появление которых особенно существенно и значимо. Один из возможных способов сделать это - решить задачу линейной множественной регрессии, где зависимая переменная - наблюдаемый временной ряд, а независимые переменные или регрессоры: функции синусов всех возможных (дискретных) частот. Такая модель линейной множественной регрессии может быть записана как:

x t = a 0 + (для k = 1 до q)

Следующее общее понятие классического гармонического анализа в этом уравнении - (лямбда) -это круговая частота, выраженная в радианах в единицу времени, т.е. = 2** k , где - константа пи = 3.1416 и k = k/q. Здесь важно осознать, что вычислительная задача подгонки функций синусов и косинусов разных длин к данным может быть решена с помощью множественной линейной регрессии. Заметим, что коэффициенты a k при косинусах и коэффициенты b k при синусах - это коэффициенты регрессии, показывающие степень, с которой соответствующие функции коррелируют с данными. Всего существует q различных синусов и косинусов; интуитивно ясно, что число функций синусов и косинусов не может быть больше числа данных в ряде. Не вдаваясь в подробности, отметим, если n - количество данных, то будет n/2+1 функций косинусов и n/2-1 функций синусов. Другими словами, различных синусоидальных волн будет столько же, сколько данных, и вы сможете полностью воспроизвести ряд по основным функциям.

В итоге, спектральный анализ определяет корреляцию функций синусов и косинусов различной частоты с наблюдаемыми данными. Если найденная корреляция (коэффициент при определенном синусе или косинусе) велика, то можно заключить, что существует строгая периодичность на соответствующей частоте в данных.

Анализ распределенных лагов - это специальный метод оценки запаздывающей зависимости между рядами. Например, предположим, вы производите компьютерные программы и хотите установить зависимость между числом запросов, поступивших от покупателей, и числом реальных заказов. Вы могли бы записывать эти данные ежемесячно в течение года и затем рассмотреть зависимость между двумя переменными: число запросов и число заказов зависит от запросов, но зависит с запаздыванием. Однако очевидно, что запросы предшествуют заказам, поэтому можно ожидать, что число заказов. Иными словами, в зависимости между числом запросов и числом продаж имеется временной сдвиг (лаг) (см. также автокорреляции и кросскорреляции).

Такого рода зависимости с запаздыванием особенно часто возникают в эконометрике. Например, доход от инвестиций в новое оборудование отчетливо проявится не сразу, а только через определенное время. Более высокий доход изменяет выбор жилья людьми; однако эта зависимость, очевидно, тоже проявляется с запаздыванием.

Во всех этих случаях, имеется независимая или объясняющая переменная, которая воздействует на зависимые переменные с некоторым запаздыванием (лагом). Метод распределенных лагов позволяет исследовать такого рода зависимость.

Общая модель

Пусть y - зависимая переменная, a независимая или объясняющая x. Эти переменные измеряются несколько раз в течение определенного отрезка времени. В некоторых учебниках по эконометрике зависимая переменная называется также эндогенной переменной, a зависимая или объясняемая переменная экзогенной переменной. Простейший способ описать зависимость между этими двумя переменными дает следующее линейное уравнение:

В этом уравнении значение зависимой переменной в момент времени t является линейной функцией переменной x, измеренной в моменты t, t-1, t-2 и т.д. Таким образом, зависимая переменная представляет собой линейные функции x и x, сдвинутых на 1, 2, и т.д. временные периоды. Бета коэффициенты (i) могут рассматриваться как параметры наклона в этом уравнении. Будем рассматривать это уравнение как специальный случай уравнения линейной регрессии. Если коэффициент переменной с определенным запаздыванием (лагом) значим, то можно заключить, что переменная y предсказывается (или объясняется) с запаздыванием.

Процедуры оценки параметров и прогнозирования, описанные в разделе, предполагают, что математическая модель процесса известна. В реальных данных часто нет отчетливо выраженных регулярных составляющих. Отдельные наблюдения содержат значительную ошибку, тогда как вы хотите не только выделить регулярные компоненты, но также построить прогноз. Методология АРПСС, разработанная Боксом и Дженкинсом (1976), позволяет это сделать. Данный метод чрезвычайно популярен во многих приложениях, и практика подтвердила его мощность и гибкость (Hoff, 1983; Pankratz, 1983; Vandaele, 1983). Однако из-за мощности и гибкости, АРПСС - сложный метод. Его не так просто использовать, и требуется большая практика, чтобы овладеть им. Хотя часто он дает удовлетворительные результаты, они зависят от квалификации пользователя (Bails and Peppers, 1982). Следующие разделы познакомят вас с его основными идеями. Для интересующихся кратким, рассчитанным на применение, (нематематическим) введением в АРПСС, рекомендуем книгу McCleary, Meidinger, and Hay (1980).

Модель АРПСС

Общая модель, предложенная Боксом и Дженкинсом (1976) включает как параметры авторегрессии, так и параметры скользящего среднего. Именно, имеется три типа параметров модели: параметры авто регрессии (p), порядок разности (d), параметры скользящего среднего (q). В обозначениях Бокса и Дженкинса модель записывается как АРПСС (p, d, q). Например, модель (0, 1, 2) содержит 0 (нуль) параметров авто регрессии (p) и 2 параметра скользящего среднего (q), которые вычисляются для ряда после взятия разности с лагом 1.

Как отмечено ранее, для модели АРПСС необходимо, чтобы ряд был стационарным, это означает, что его среднее постоянно, а выборочные дисперсия и автокорреляция не меняются во времени. Поэтому обычно необходимо брать разности ряда до тех пор, пока он не станет стационарным (часто также применяют логарифмическое преобразование для стабилизации дисперсии). Число разностей, которые были взяты, чтобы достичь стационарности, определяются параметром d (см. предыдущий раздел). Для того чтобы определить необходимый порядок разности, нужно исследовать график ряда и автокоррелограмму. Сильные изменения уровня (сильные скачки вверх или вниз) обычно требуют взятия несезонной разности первого порядка (лаг=1). Сильные изменения наклона требуют взятия разности второго порядка. Сезонная составляющая требует взятия соответствующей сезонной разности (см. ниже). Если имеется медленное убывание выборочных коэффициентов автокорреляции в зависимости от лага, обычно берут разность первого порядка. Однако следует помнить, что для некоторых временных рядов нужно брать разности небольшого порядка или вовсе не брать их. Заметим, что чрезмерное количество взятых разностей приводит к менее стабильным оценкам коэффициентов.

На этом этапе (который обычно называют идентификацией порядка модели, см. ниже) вы также должны решить, как много параметров авто регрессии (p) и скользящего среднего (q) должно присутствовать в эффективной и экономной модели процесса. (Экономность модели означает, что в ней имеется наименьшее число параметров и наибольшее число степеней свободы среди всех моделей, которые подгоняются к данным). На практике очень редко бывает, что число параметров p или q больше 2 (см. ниже более полное обсуждение).

Следующий, после идентификации, шаг (Оценивание) состоит в оценивании параметров модели (для чего используются процедуры минимизации функции потерь, см. ниже; более подробная информация о процедурах минимизации дана в разделе Нелинейное оценивание). Полученные оценки параметров используются на последнем этапе (Прогноз) для того, чтобы вычислить новые значения ряда и построить доверительный интервал для прогноза. Процесс оценивания проводится по преобразованным данным (подвергнутым применению разностного оператора). До построения прогноза нужно выполнить обратную операцию (интегрировать данные). Таким образом, прогноз методологии будет сравниваться с соответствующими исходными данными. На интегрирование данных указывает буква П в общем названии модели (АРПСС = Авто регрессионное Проинтегрированное Скользящее Среднее).

Дополнительно модели АРПСС могут содержать константу, интерпретация которой зависит от подгоняемой модели. Именно, если (1) в модели нет параметров авто регрессии, то константа есть среднее значение ряда, если (2) параметры авто регрессии имеются, то константа представляет собой свободный член. Если бралась разность ряда, то константа представляет собой среднее или свободный член преобразованного ряда. Например, если бралась первая разность (разность первого порядка), а параметров авто регрессии в модели нет, то константа представляет собой среднее значение преобразованного ряда и, следовательно, коэффициент наклона линейного тренда исходного.

Экспоненциальное сглаживание - это очень популярный метод прогнозирования многих временных рядов. Исторически метод был независимо открыт Броуном и Холтом.

Простое экспоненциальное сглаживание

Простая и прагматически ясная модель временного ряда имеет следующий вид:

где b - константа и (эпсилон) - случайная ошибка. Константа b относительно стабильна на каждом временном интервале, но может также медленно изменяться со временем. Один из интуитивно ясных способов выделения b состоит в том, чтобы использовать сглаживание скользящим средним, в котором последним наблюдениям приписываются большие веса, чем предпоследним, предпоследним большие веса, чем пред предпоследним и т.д. Простое экспоненциальное именно так и устроено. Здесь более старым наблюдениям приписываются экспоненциально убывающие веса, при этом, в отличие от скользящего среднего, учитываются все предшествующие наблюдения ряда, а не те, что попали в определенное окно. Точная формула простого экспоненциального сглаживания имеет следующий вид:

S t = *X t + (1-)*S t-1

Когда эта формула применяется рекурсивно, то каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, результат сглаживания зависит от параметра (альфа). Если равно 1, то предыдущие наблюдения полностью игнорируются. Если равно 0, то игнорируются текущие наблюдения. Значения между 0, 1 дают промежуточные результаты.

Эмпирические исследования Makridakis и др. (1982; Makridakis, 1983) показали, что весьма часто простое экспоненциальное сглаживание дает достаточно точный прогноз.

Выбор лучшего значения параметра (альфа)

Gardner (1985) обсуждает различные теоретические и эмпирические аргументы в пользу выбора определенного параметра сглаживания. Очевидно, из формулы, приведенной выше, следует, что должно попадать в интервал между 0 (нулем) и 1 (хотя Brenner et al., 1968, для дальнейшего применения анализа АРПСС считают, что 0<<2). Gardner (1985) сообщает, что на практике обычно рекомендуется брать меньше.30. Однако в исследовании Makridakis et al., (1982), большее.30, часто дает лучший прогноз. После обзора литературы, Gardner (1985) приходит к выводу, что лучше оценивать оптимально по данным (см. ниже), чем просто "гадать" или использовать искусственные рекомендации.

Оценивание лучшего значения с помощью данных. На практике параметр сглаживания часто ищется с поиском на сетке. Возможные значения параметра разбиваются сеткой с определенным шагом. Например, рассматривается сетка значений от = 0.1 до = 0.9, с шагом 0.1. Затем выбирается, для которого сумма квадратов (или средних квадратов) остатков (наблюдаемые значения минус прогнозы на шаг вперед) является минимальной.

Индексы качества подгонки

Самый прямой способ оценки прогноза, полученного на основе определенного значения - построить график наблюдаемых значений и прогнозов на один шаг вперед. Этот график включает в себя также остатки (отложенные на правой оси Y). Из графика ясно видно, на каких участках прогноз лучше или хуже.

Такая визуальная проверка точности прогноза часто дает наилучшие результаты. Имеются также другие меры ошибки, которые можно использовать для определения оптимального параметра (см. Makridakis, Wheelwright, and McGee, 1983):

Средняя ошибка. Средняя ошибка (СО) вычисляется простым усреднением ошибок на каждом шаге. Очевидным недостатком этой меры является то, что положительные и отрицательные ошибки аннулируют друг друга, поэтому она не является хорошим индикатором качества прогноза.

Средняя абсолютная ошибка. Средняя абсолютная ошибка (САО) вычисляется как среднее абсолютных ошибок. Если она равна 0 (нулю), то имеем совершенную подгонку (прогноз). В сравнении со средней квадратической ошибкой, эта мера "не придает слишком большого значения" выбросам.

Сумма квадратов ошибок (SSE), среднеквадратическая ошибка. Эти величины вычисляются как сумма (или среднее) квадратов ошибок. Это наиболее часто используемые индексы качества подгонки.

Относительная ошибка (ОО). Во всех предыдущих мерах использовались действительные значения ошибок. Представляется естественным выразить индексы качества подгонки в терминах относительных ошибок. Например, при прогнозе месячных продаж, которые могут сильно флуктуировать (например, по сезонам) из месяца в месяц, вы можете быть вполне удовлетворены прогнозом, если он имеет точность?10%. Иными словами, при прогнозировании абсолютная ошибка может быть не так интересна как относительная. Чтобы учесть относительную ошибку, было предложено несколько различных индексов (см. Makridakis, Wheelwright, and McGee, 1983). В первом относительная ошибка вычисляется как:

ОО t = 100*(X t - F t)/X t

где X t - наблюдаемое значение в момент времени t, и F t - прогноз (сглаженное значение).

Средняя относительная ошибка (СОО). Это значение вычисляется как среднее относительных ошибок.

Средняя абсолютная относительная ошибка (САОО). Как и в случае с обычной средней ошибкой отрицательные и положительные относительные ошибки будут подавлять друг друга. Поэтому для оценки качества подгонки в целом (для всего ряда) лучше использовать среднюю абсолютную относительную ошибку. Часто эта мера более выразительная, чем среднеквадратическая ошибка. Например, знание того, что точность прогноза ±5%, полезно само по себе, в то время как значение 30.8 для средней квадратической ошибки не может быть так просто проинтерпретировано.

Автоматический поиск лучшего параметра. Для минимизации средней квадратической ошибки, средней абсолютной ошибки или средней абсолютной относительной ошибки используется квази-ньютоновская процедура (та же, что и в АРПСС). В большинстве случаев эта процедура более эффективна, чем обычный перебор на сетке (особенно, если параметров сглаживания несколько), и оптимальное значение можно быстро найти.

Первое сглаженное значение S 0 . Если вы взгляните снова на формулу простого экспоненциального сглаживания, то увидите, что следует иметь значение S 0 для вычисления первого сглаженного значения (прогноза). В зависимости от выбора параметра (в частности, если близко к 0), начальное значение сглаженного процесса может оказать существенное воздействие на прогноз для многих последующих наблюдений. Как и в других рекомендациях по применению экспоненциального сглаживания, рекомендуется брать начальное значение, дающее наилучший прогноз. С другой стороны, влияние выбора уменьшается с длиной ряда и становится некритичным при большом числе наблюдений.

экономический временный ряд статистический

Заключение

Анализ временных рядов -- совокупность математико-статистических методов анализа, предназначенных для выявления структуры временных рядов и для их прогноза. Сюда относятся, в частности, методы регрессионного анализа. Выявление структуры временного ряда необходимо для того, чтобы построить математическую модель того явления, которое является источником анализируемого временного ряда. Прогноз будущих значений временного ряда используется для эффективного принятия решений.

Временные ряды исследуются с различными целями. Метод анализа временного ряда определяется, с одной стороны, целями анализа, а с другой стороны, вероятностной природой формирования его значений.

Основными методами исследования временных рядов являются:

Ш Спектральный анализ.

Ш Корреляционный анализ

Ш Сезонная модель Бокса-Дженкинса.

Ш Прогноз экспоненциально взвешенным скользящим средним.

Литература

1. Безручко Б. П., Смирнов Д. А. Математическое моделирование и хаотические временные ряды. -- Саратов: ГосУНЦ "Колледж", 2005. -- ISBN 5-94409-045-6

2. Блехман И. И., Мышкис А. Д., Пановко Н. Г., Прикладная математика: Предмет, логика, особенности подходов. С примерами из механики: Учебное пособие. -- 3-е изд., испр. и доп. -- М.: УРСС, 2006. -- 376 с. ISBN 5-484-00163-3

3. Введение в математическое моделирование. Учебное пособие. Под ред. П. В. Трусова. -- М.: Логос, 2004. -- ISBN 5-94010-272-7

4. Горбань А. Н., Хлебопрос Р. Г., Демон Дарвина: Идея оптимальности и естественный отбор. -- М: Наука. Гл ред. физ.-мат. лит., 1988. -- 208 с. (Проблемы науки и технического прогресса) ISBN 5-02-013901-7 (Глава «Изготовление моделей»).

5. Журнал Математическое моделирование (основан в 1989 году)

6. Малков С. Ю., 2004. Математическое моделирование исторической динамики: подходы и модели // Моделирование социально-политической и экономической динамики / Ред. М. Г. Дмитриев. -- М.: РГСУ. -- с. 76-188.

7. Мышкис А. Д., Элементы теории математических моделей. -- 3-е изд., испр. -- М.: КомКнига, 2007. -- 192 с ISBN 978-5-484-00953-4

8. Самарский А. А., Михайлов А. П. Математическое моделирование. Идеи. Методы. Примеры.. -- 2-е изд., испр.. -- М.: Физматлит, 2001. -- ISBN 5-9221-0120-X

9. Советов Б. Я., Яковлев С. А., Моделирование систем: Учеб. для вузов -- 3-е изд., перераб. и доп. -- М.: Высш. шк., 2001. -- 343 с. ISBN 5-06-003860-2

Размещено на Allbest.ru

Подобные документы

    Понятие и основные этапы разработки прогноза. Задачи анализа временных рядов. Оценка состояния и тенденций развития прогнозирования на основе анализа временных рядов СУ-167 ОАО "Мозырьпромстрой", практические рекомендации по его совершенствованию.

    курсовая работа , добавлен 01.07.2013

    Методика проведения анализа динамических рядов социально-экономических явлений. Компоненты, формирующие уровни при анализе рядов динамики. Порядок составления модели экспорта и импорта Нидерландов. Уровни автокорреляции. Корреляция рядов динамики.

    курсовая работа , добавлен 13.05.2010

    Методы анализа структуры временных рядов, содержащих сезонные колебания. Рассмотрение подхода методом скользящей средней и построение аддитивной (или мультипликативной) модели временного ряда. Расчет оценок сезонной компоненты в мультипликативной модели.

    контрольная работа , добавлен 12.02.2015

    Анализ системы показателей, характеризующих как адекватность модели, так и ее точность; определение абсолютной и средней ошибок прогноза. Основные показатели динамики экономических явлений, использование средних значений для сглаживания временных рядов.

    контрольная работа , добавлен 13.08.2010

    Сущность и отличительные черты статистических методов анализа: статистическое наблюдение, группировка, анализа рядов динамики, индексный, выборочный. Порядок проведения анализа рядов динамики, анализа основной тенденции развития в рядах динамики.

    курсовая работа , добавлен 09.03.2010

    Проведение экспериментального статистического исследования социально-экономических явлений и процессов Смоленской области на основе заданных показателей. Построение статистических графиков, рядов распределения, вариационных рядов, их обобщение и оценка.

    курсовая работа , добавлен 15.03.2011

    Виды временных рядов. Требования, предъявляемые к исходной информации. Описательные характеристики динамики социально-экономических явлений. Прогнозирование по методу экспоненциальных средних. Основные показатели динамики экономических показателей.

    контрольная работа , добавлен 02.03.2012

    Понятие и значение временного ряда в статистике, его структура и основные элементы, значение. Классификация и разновидности временных рядов, особенности сферы их применения, отличительные характеристики и порядок определения в них динамики, стадии, ряды.

    контрольная работа , добавлен 13.03.2010

    Определение понятия цен на продукцию и услуги; принципы их регистрации. Расчет индивидуальных и общих индексов стоимости товаров. Сущность базовых методов социально-экономических исследований - структурных средних, рядов распределения и рядов динамики.

    курсовая работа , добавлен 12.05.2011

    Машинное обучение и статистические методы анализа данных. Оценка точности прогнозирования. Предварительная обработка данных. Методы классификации, регрессии и анализа временных рядов. Методы ближайших соседей, опорных векторов, спрямляющего пространства.

1 Виды и методы анализа временных рядов

Временным рядом называется ряд наблюдений за значениями некоторого показателя (признака), упорядоченный в хронологической последовательности, т.е. в порядке возрастания переменной t- временного параметра. Отдельные наблюдения временного ряда называются уровнями этого ряда.

1.1 Виды временных рядов

Временные ряды делятся на моментные и интервальные. В моментных временных рядах уровни характеризуют значения показателя по состоянию на определенные моменты времени. Например, моментными являются временные ряды цен на определенные виды товаров, временные ряды курсов акций, уровни которых фиксируются для конкретных чисел. Примерами моментных временных рядов могут служить также ряды численности населения или стоимости основных фондов, т.к. значения уровней этих рядов определяются ежегодно на одно и то же число.

В интервальных рядах уровни характеризуют значение показателя за определенные интервалы (периоды) времени. Примерами рядов этого типа могут служить временные ряды производства продукции в натуральном или стоимостном выражении за месяц, квартал, год и т.д.

Иногда уровни ряда представляют собой не непосредственно наблюдаемые значения, а производные величины: средние или относительные. Такие ряды называются производными. Уровни таких временных рядов получаются с помощью некоторых вычислений на основе непосредственно наблюдаемых показателей. Примерами таких рядов могут служить ряды среднесуточного производства основных видов промышленной продукции или ряды индексов цен.

Уровни ряда могут принимать детерминированные или случайные значения. Примером ряда с детерминированными значениями уровней служит ряд последовательных данных о количестве дней в месяцах. Естественно, анализу, а в дальнейшем и прогнозированию, подвергаются ряды со случайными значениями уровней. В таких рядах каждый уровень может рассматриваться как реализация случайной величины - дискретной или непрерывной.

1.2 Методы анализа временных рядов

Методы анализа временных рядов. Для решения этих задач существует большое количество различных методов. Из них наиболее распространенными являются следующие:

1. Корреляционный анализ, позволяющий выявить существенные периодические зависимости и их лаги (задержки) внутри одного процесса (автокорреляция) или между несколькими процессами (кросскорреляция);

2. Спектральный анализ, позволяющий находить периодические и квазипериодические составляющие временного ряда;

3. Сглаживание и фильтрация, предназначенные для преобразования временных рядов с целью удаления из них высокочастотных или сезонных колебаний;

5. Прогнозирование, позволяющее на основе подобранной модели поведения временного рада предсказывать его значения в будущем.

2 Основы прогнозирования развития перерабатывающих отраслей и торговых организаций

2.1 Прогнозирование развития перерабатывающих предприятий

Сельскохозяйственная продукция производится на предприятиях различных организационных форм. Здесь она может храниться, сортироваться и готовиться к переработке, вместе с тем могут быть и специализированные предприятия хранения. Дальше продукция транспортируется на перерабатывающие предприятия, где производится разгрузка, хранение, сортировка, переработка, фасовка; отсюда осуществляется транспортировка в торговые предприятия. На самих же предприятиях торговли производится реализация послепродажная упаковка и доставка.

Все виды перечисленных технологически и организационных операций должны прогнозироваться и планироваться. При этом используются различные приемы и методы.

Но надо отметить, что пищевые перерабатывающие предприятия имеют некоторую специфику планирования.

Пищевая перерабатывающая промышленность занимает важное место в системе АПК. Сельскохозяйственное производство обеспечивает эту промышленность сырьевыми ресурсами, то есть по существу, имеется жесткая технологическая связь между сферами 2 и 3 АПК.

В зависимости от вида используемого сырья и особенностей реализации конечной продукции сложились три группы отраслей пищевой и перерабатывающей промышленности: первичной и вторичной переработки сельскохозяйственных ресурсов и добывающей пищевой промышленности. В первую группу входят отрасли, которые перерабатывают малотранспортабельную сельскохозяйственную продукцию (крахмалопаточная, плодоовощеконсервная, спиртовая и др.), во вторую – отрасли использующие сельскохозяйственное сырьё, которое прошло первичную переработку (хлебопекарная, кондитерская, пищеконцетратная, производство сахара рафинада и др.). К третьей группе относятся соленая и рыбная отрасли.

Предприятия первой группы располагаются ближе к районам производства сельскохозяйственное продукции, здесь производство носит сезонный характер. Предприятия второй группы тяготеют, как правила, к районам потребления этой продукции; они работают ритмично на протяжении всего года.

Наряду с общими особенностями предприятия всех трех групп имеют свои внутренние, обусловленные номенклатурой выпускаемой продукции, в используемых технических средствах, технологиях, организации труда и производства и др.

Важным исходным началом прогнозирования этих отраслей является учет внешних и внутренних особенностей, специфики каждой отрасли промышленности.

В состав пищевых и перерабатывающих отраслей АПК входят зерноперерабатывающая, хлебопекарная и макаронная, сахарная, маложирная, кондитерская, плодоовощная, пищеконцетратная и др.

2.2 Прогнозирование развития торговых организаций

В торговле при ее прогнозировании используются те же методы, что и в других отраслях народного хозяйства. Перспективными являются создание рыночных структур в виде сети оптовых продовольственных рынков, совершенствование фирменной торговли, а также создание широкой информационной сети. Оптовая торговля позволяет сократить количество посредников при доведении продукции от товаропроизводителя до потребителя, создать альтернативные каналы реализации, точнее прогнозировать потребительский спрос и предложение.

В большинстве случаев план экономического и социального развития торгового предприятия состоит в основном из пяти разделов: розничный и оптовый товарооборот и товарное обеспечение; финансовый план; развитие материально-технической базы; социально развитие коллективов; план по труду.

Планы могут разрабатываться в виде долгосрочных – до 10 лет, среднесрочных – от трех до пяти лет, текущих – до одного месяца.

В основе планирования – товарооборот по каждой ассортиментной группе товаров.

Оптовый и розничный товарооборот может прогнозироваться в следующей последовательности:

1. оценивают ожидаемое выполнение плана за текущий год;

2. исчисляют среднегодовые темпы товарооборота за два-три года, предшествовавших периоду прогноза;

3. на основании анализа первых двух позиций экспертным методом устанавливают в процентах темпы роста (снижения) продажи отдельных товаров (товарных групп на прогнозируемый период).

Умножением объема ожидаемого товарооборота за текущий год на прогнозируемый темп роста продажи рассчитывают возможный товарооборот в прогнозируемом периоде.

Необходимые товарные ресурсы состоят из ожидаемого товарооборота и товарных запасов. Товарные запасы могут измеряться в натуральном и денежном выражении или в днях оборота. Товарные запасы обычно планируют на основе экстраполяции данных по четвертому кварталу за ряд лет.

Товарное обеспечение определяют путем сравнения потребности в необходимых товарных ресурсах и их источников. Необходимые товарные ресурсы рассчитывают как сумму товарооборота, вероятного прироста товарных запасов за минусом естественной убыли товаров и их уценки.

Финансовый план торгового предприятия включает кассовый план, кредитный план и сметы доходов и расходов. Кассовый план составляю по квартально, в кредитном плане определяют потребность в различных видах кредита, в смете доходов и расходов – по статьям доходы и поступления денежных средств, расходы и отчисления средств.

Объектами планирования материально-технической базы является торговая сеть, техническое оснащение, складское хозяйство, то есть планируются общая потребность в торговой площади, торговых предприятиях, их размещение и специализация, потребность в механизмах и оборудовании, необходимые складские емкости.

Показатели социального развития коллектива включают разработку планов повышения квалификации, улучшения условий труда и охраны здоровья работников, жилищных и культурно-бытовых условий, развития общественной активности.

Достаточно сложным разделом является план по труду. Необходимо подчеркнуть, что в торговле результатом труда выступает не продукт, а услуга, здесь преобладают затраты живого труда в связи с затруднением механизации большинства трудоемких процессов.

Производительность труда в торговле измеряется показателями среднего товарооборота, приходящегося на одного работника за определенный период времени, то есть сумма товарооборота делится на среднесписочную численность работников. В связи с тем что реализация различных товаров по своей трудоемкости не одинакова, при планировании следует учитывать изменения в товарообороте, индексы цен, ассортиментный состав товаров.

Развитие товарооборота требует увеличения количества предприятий торговли, общественного питания. При расчете количества на плановый период исходя из нормативов обеспеченности населения торговыми предприятиями для городской и сельской местности.

В качестве примера приведем содержание плана экономического и социального развития плодоовощного торгового предприятия. Он включает следующие разделы: исходные данные; основные экономические показатели работы предприятия; техническое и организационное развитие предприятия; план закладки продукции на длительное хранение; план реализации продукции; план розничного товарооборота; распределение издержек по завозу, хранению и оптовой реализации по группам товаров; издержки обращения розничной реализации продукции; затраты на производства продукции, ее переработку и реализацию; численность работников и фонд заработной планы; прибыль от оптовой реализации продукции; план прибыли от всех видов деятельности; распределение дохода; распределение прибыли; социальное развитие коллектива; финансовый план. Методика составления этого плана такая же, как и в других отраслях АПК.

3 Расчет прогноза экономического временного ряда

Имеются данные об экспорте железобетонной продукции товаров (в страны вне СНГ), млрд. долларов США.

Таблица 1

Экспорт товаров за 2002, 2003, 2004, 2005 годы (млрд.долларов США)

Прежде, чем приступить к анализу, обратимся к графическому изображению исходных данных (рис. 1).

Рис. 1. Экспорт товаров

Как видно из построенного графика, четко прослеживается тенденция к увеличению объемов импорта. Проанализировав полученный график можно сделать вывод о нелинейном развитии процесса, предположив об экспоненциальном или параболическом развитии.

Теперь сделаем графический анализ квартальных данных за четыре года:

Таблица 2

Экспорт товаров за кварталы 2002,2003, 2004 и 2005 годов

Рис. 2. Экспорт товаров

Как видно из графика яркое выражение имеет сезонность колебаний. Амплитуда колебания довольно не фиксированная, что указыает на наличие мультипликативной модели.

В исходных данных нам представлен интервальный ряд с равноотстоящими уровнями во времени. Поэтому для определения среднего уровня ряда воспользуемся следующей формулой:

Млрд.долл.

Для количественной оценки динамики явлений применяются следующие основные аналитические показатели:

· абсолютный прирост;

· темпы роста;

· темпы прироста.

Рассчитаем каждый из этих показателей для интервального ряда с равноотстоящими уровнями во времени.

Представим статистические показатели динамики в виде таблицы 3.

Таблица 3

Статистические показатели динамики

t y t Абсолютный прирост, млрд.долларов США Темп роста, % Темп прироста, %
Цепной Базисный Цепной Базисный Цепной Базисный
1 48,8 - - - - - -
2 61,0 12,2 12,2 125 125 25 25
3 77,5 16,5 28,7 127,05 158,81 27,05 58,81
4 103,5 26 54,7 133,55 212,09 33,55 112,09

Темпы роста были примерно одинаковые. Это говорит о том, что для определения прогнозного значения можно использовать средний темп роста:

Проверим гипотезу о наличии тренда с помощью критерия Фостера-Стюарта . Для этого заполним вспомогательную таблицу 4:

Таблица 4

Вспомогательная таблица

t yt mt lt d t yt mt lt d
1 9,8 - - - 9 16,0 0 0 0
2 11,8 1 0 1 10 18,0 1 0 1
3 12,6 1 0 1 11 19,8 1 0 1
4 14,6 1 0 1 12 23,7 1 0 1
5 12,9 0 0 0 13 21,0 0 0 0
6 14,7 1 0 1 14 23,9 1 0 1
7 15,5 1 0 1 15 26,9 1 0 1
8 17,8 1 0 1 16 31,7 1 0 1

Применим критерий Стьюдента:

Получаем, , то есть , следовательно гипотеза Н 0 отвергается, тренд есть.

Проанализируем структуру временного ряда с использованием коэффициента автокорреляции.

Найдем последовательно коэффициенты автокорреляции:

коэффициент автокорреляции первого порядка, так как сдвиг во времени равен единице (-лаг).

Аналогично находим остальные коэффициенты.

– коэффициент автокорреляции второго порядка.

– коэффициент автокорреляции третьего порядка.

– коэффициент автокорреляции четвертого порядка.

Таким образом, мы видим, что самым высоким является коэффициент автокорреляции четвертого порядка. Это говорит о том, что во временном ряде присутствуют сезонные колебания с периодичностью в четыре квартала.

Проверим значимость коэффициента автокорреляции. Для этого введем две гипотезы: Н 0: , Н 1: .

Находится по таблице критических значений отдельно для >0 и <0. Причем, если ||>||, то принимается гипотеза Н 1 ,то есть коэффициент значим. Если ||<||, то принимается гипотеза Н 0 и коэффициент автокорреляции незначим. В нашем случае коэффициент автокорреляции достаточно велик, и проверять его значимость необязательно.

Требуется провести сглаживание временного ряда и восстановить потерянные уровни.

Проведем сглаживание временного ряда с помощью простой скользящей средней. Результаты расчетов представим в виде следующей таблицы 13.

Таблица 5

Сглаживание исходного ряда с помощью скользящей средней

№ года № квартала t Импорт товаров, млрд.долларов США, yt Скользящая средняя,
1 I 1 9,8 - -
II 2 11,8 - -
III 3 12,6 12 , 59 1,001
IV 4 14,6 13,34 1,094
2 I 5 12,9 14,06 0,917
II 6 14,7 14,83 0,991
III 7 15,5 15,61 0,993
IV 8 17,8 16,41 1,085
3 I 9 16 17,36 0,922
II 10 18 18,64 0,966
III 11 19,8 20,0 0,990
IV 12 23,7 21,36 1,110
4 I 13 21 22,99 0,913
II 14 23,9 24,88 0,961
III 15 26,9 - -
IV 16 31,7 - -

Теперь рассчитаем отношение фактических значений к уровням сглаженного ряда. В результате получим временной ряд, уровни которого отражают влияние случайных факторов и сезонности.

Предварительные оценки сезонной составляющей получим усреднением уровней временного ряда для одноименных кварталов:

Для I квартала:

Для II квартала:

Для II квартала:

Для IV квартала:

Взаимопогашаемость сезонных воздействий в мультипликативной форме выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна числу фаз в цикле. В нашем случае число фаз равно четырем. Просуммировав средние значения по кварталам, получаем:

Поскольку сумма получилась неравной четырем, необходимо произвести корректировку значений сезонной составляющей. Найдем поправку, на которую надо изменить предварительные оценки сезонности:

Определяем скорректированные значения сезонной, результаты сведем в таблицу 6.

Таблица 6

Оценивание сезонной компоненты в мультипликативной модели .

№ квартала i Предварительная оценка сезонной компоненты, Скорректированное значение сезонной компоненты,
I 1 0,917 0,921
II 2 0,973 0,978
III 3 0,995 1,000
IV 4 1,096 1,101
3,981 4

Проводим сезонную корректировку исходных данных, то есть, удаляем сезонную составляющую.

Таблица 7

Построение мультипликативной тренд сезонной модели.

t Импорт товаров , млрд.долларов США Сезонная компонента, Десезонализированный импорт товаров, Расчетное значение, Расчетное значение импорта товаров,
1 9,8 0,921 10,6406 11,48 10,57308
2 11,8 0,978 12,0654 11,85 11,5893
3 12,6 1 12,6 12,32 12,32
4 14,6 1,101 13,2607 12,89 14,19189
5 12,9 0,921 14,0065 13,56 12,48876
6 14,7 0,978 15,0307 14,33 14,01474
7 15,5 1 15,5 15,2 15,2
8 17,8 1,101 16,1671 16,17 17,80317
9 16 0,921 17,3724 17,24 15,87804
10 18 0,978 18,4049 18,41 18,00498
11 19,8 1 19,8 19,68 19,68
12 23,7 1,101 21,5259 21,05 23,17605
13 21 0,921 22,8013 22,52 20,74092
14 23,9 0,978 24,4376 24,09 23,56002
15 26,9 1 26,9 25,76 25,76
16 31,7 1,101 28,792 27,53 30,31053

По МНК получаем следующее уравнение тренда:3

12,6 12,32 0,28 0,0784 0,021952 0,006147 4 14,6 14,19 0,41 0,1681 0,068921 0,028258 5 12,9 12,49 0,41 0,1681 0,068921 0,028258 6 14,7 14,01 0,69 0,4761 0,328509 0,226671 7 15,5 15,2 0,3 0,09 0,027 0,0081 8 17,8 17,8 0 0 0 0 9 16 15,88 0,12 0,0144 0,001728 0,000207 10 18 18 0 0 0 0 11 19,8 19,68 0,12 0,0144 0,001728 0,000207 12 23,7 23,18 0,52 0,2704 0,140608 0,073116 13 21 20,74 0,26 0,0676 0,017576 0,00457 14 23,9 23,56 0,34 0,1156 0,039304 0,013363 15 26,9 25,76 1,14 1,2996 1,481544 1,68896 16 31,7 30,31 1,39 1,9321 2,685619 3,73301 ∑ 290,7 5,3318 4,436138 6,164343

Изобразим графически ряд остатков:

Рис. 3. График остатков

Проанализировав полученный график можно сделать вывод о случайности колебаний этого ряда.

Так же качество модели можно проверить с помощью показателей асимметрии и эксцесса остатков. В нашем случае получаем:

,

то гипотеза о нормальном распределении остатков отвергается.

Поскольку одно из неравенств выполняется, то уместен вывод о том, что гипотеза о нормальном характере распределения остатков отвергается.

Заключительным этапом применения кривых роста является расчет прогнозов на базе выбранного уравнения.

Для прогнозирования импорта товаров в следующем году оценим значения тренда при t =17, t =18, t =19 и t =20:

4. Личко Н.М. Планирование на предприятиях АПК. – М., 1996.

5. Финам. События и рынки, – http://www.finam.ru/

3.3.1. Методы анализа и прогнозирования временных рядов

Модели стационарных и нестационарных временных рядов. Пусть Рассмотрим временной ряд X (t ). Пусть сначала временной ряд принимает числовые значения. Это могут быть, например, цены на батон хлеба в соседнем магазине или курс обмена доллара на рубли в ближайшем обменном пункте. Обычно в поведении временного ряда выявляют две основные тенденции - тренд и периодические колебания.

При этом под трендом понимают зависимость от времени линейного, квадратичного или иного типа, которую выявляют тем или иным способом сглаживания (например, экспоненциального сглаживания) либо расчетным путем, в частности, с помощью метода наименьших квадратов. Другими словами, тренд - это очищенная от случайностей основная тенденция временного ряда.

Временной ряд обычно колеблется вокруг тренда, причем отклонения от тренда часто обнаруживают правильность. Часто это связано с естественной или назначенной периодичностью, например, сезонной или недельной, месячной или квартальной (например, в соответствии с графиками выплаты заплаты и уплаты налогов). Иногда наличие периодичности и тем более ее причины неясны, и задача статистика - выяснить, действительно ли имеется периодичность.

Элементарные методы оценки характеристик временных рядов обычно достаточно подробно рассматриваются в курсах "Общей теории статистики" (см., например, учебники ), поэтому нет необходимости подробно разбирать их здесь. О некоторых современных методах оценивания длины периода и самой периодической составляющей речь пойдет ниже в подразделе 3.3.2.

Характеристики временных рядов. Для более подробного изучения временных рядов используются вероятностно-статистические модели. При этом временной ряд X (t ) рассматривается как случайный процесс (с дискретным временем). Основными характеристиками X (t ) являются математическое ожидание X (t ), т.е.

дисперсия X (t ), т.е.

и автокорреляционная функция временного ряда X (t )

т.е. функция двух переменных, равная коэффициенту корреляции между двумя значениями временного ряда X (t ) и X (s ).

В теоретических и прикладных исследованиях рассматривают широкий спектр моделей временных рядов. Выделим сначала стационарные модели. В них совместные функции распределения для любого числа моментов времени k , а потому и все перечисленные выше характеристики временного ряда не меняются со временем . В частности, математическое ожидание и дисперсия являются постоянными величинами, автокорреляционная функция зависит только от разности t - s. Временные ряды, не являющиеся стационарными, называются нестационарными.

Линейные регрессионные модели с гомоскедастичными и гетероскедастичными, независимыми и автокоррелированными остатками. Как видно из сказанного выше, основное - это "очистка" временного ряда от случайных отклонений, т.е. оценивание математического ожидания. В отличие от простейших моделей регрессионного анализа, рассмотренных в главе 3.2, здесь естественным образом появляются более сложные модели. Например, дисперсия может зависеть от времени. Такие модели называют гетероскедастичными, а те, в которых нет зависимости от времени - гомоскедастичными. (Точнее говоря, эти термины могут относиться не только к переменной "время", но и к другим переменным.)

Далее, в главе 3.2 предполагалось, что погрешности независимы между собой. В терминах настоящей главы это означало бы, что автокорреляционная функция должна быть вырожденной - равняться 1 при равенстве аргументов и 0 при их неравенстве. Ясно, что для реальных временных рядов так бывает отнюдь не всегда. Если естественный ход изменений наблюдаемого процесса является достаточно быстрым по сравнению с интервалом между последовательными наблюдениями, то можно ожидать "затухания" автокорреляции" и получения практически независимых остатков, в противном случае остатки будут автокоррелированы.

Идентификация моделей. Под идентификацией моделей обычно понимают выявление их структуры и оценивание параметров. Поскольку структура - это тоже параметр, хотя и нечисловой, то речь идет об одной из типовых задач прикладной статистики - оценивании параметров.

Проще всего задача оценивания решается для линейных (по параметрам) моделей с гомоскедастичными независимыми остатками. Восстановление зависимостей во временных рядах может быть проведено на основе методов наименьших квадратов и наименьших модулей оценивания параметров в моделях линейной (по параметрам) регрессии. На случай временных рядов переносятся результаты, связанные с оцениванием необходимого набора регрессоров, в частности, легко получить предельное геометрическое распределение оценки степени тригонометрического полинома.

Однако на более общую ситуацию такого простого переноса сделать нельзя. Так, например, в случае временного ряда с гетероскедастичными и автокоррелированными остатками снова можно воспользоваться общим подходом метода наименьших квадратов, однако система уравнений метода наименьших квадратов и, естественно, ее решение будут иными. Формулы в терминах матричной алгебры, о которых упоминалось в главе 3.2, будут отличаться. Поэтому рассматриваемый метод называется "обобщенный метод наименьших квадратов (ОМНК)".

Замечание. Как уже отмечалось в главе 3.2, простейшая модель метода наименьших квадратов допускает весьма далекие обобщения, особенно в области системам одновременных эконометрических уравнений для временных рядов. Для понимания соответствующей теории и алгоритмов необходимо владение методами матричной алгебры. Поэтому мы отсылаем тех, кому это интересно, к литературе по системам эконометрических уравнений и непосредственно по временным рядам , в которой особенно много интересуются спектральной теорией, т.е. выделением сигнала из шума и разложением его на гармоники. Подчеркнем еще раз, что за каждой главой настоящей книги стоит большая область научных и прикладных исследований, вполне достойная того, чтобы посвятить ей много усилий. Однако из-за ограниченности объема книги мы вынуждены изложение сделать конспективным.

Системы эконометрических уравнений. В качестве первоначального примера рассмотрим эконометрическую модель временного ряда, описывающего рост индекса потребительских цен (индекса инфляции). Пусть I (t ) - рост цен в месяц t (подробнее об этой проблематике см. главу 7 в ). По мнению некоторых экономистов естественно предположить, что

I (t ) = с I (t - 1) + a + bS (t - 4) + e , (1)

где I (t -1) - рост цен в предыдущий месяц (а с - некоторый коэффициент затухания, предполагающий, что при отсутствии внешний воздействий рост цен прекратится), a - константа (она соответствует линейному изменению величины I (t ) со временем), bS (t- 4) - слагаемое, соответствующее влиянию эмиссии денег (т.е. увеличения объема денег в экономике страны, осуществленному Центральным Банком) в размере S (t- 4) и пропорциональное эмиссии с коэффициентом b , причем это влияние проявляется не сразу, а через 4 месяца; наконец, e - это неизбежная погрешность.

Модель (1), несмотря на свою простоту, демонстрирует многие характерные черты гораздо более сложных эконометрических моделей. Во-первых, обратим внимание на то, что некоторые переменные определяются (рассчитываются) внутри модели, такие, как I (t ). Их называют эндогенными (внутренними). Другие задаются извне (это экзогенные переменные). Иногда, как в теории управления, среди экзогенных переменных, выделяют управляемые переменные - те, с помощью выбора значений которых можно привести систему в нужное состояние.

Во-вторых, в соотношении (1) появляются переменные новых типов - с лагами, т.е. аргументы в переменных относятся не к текущему моменту времени, а к некоторым прошлым моментам.

В-третьих, составление эконометрической модели типа (1) - это отнюдь не рутинная операция. Например, запаздывание именно на 4 месяца в связанном с эмиссией денег слагаемом bS (t- 4) - это результат достаточно изощренной предварительной статистической обработки. Далее, требует изучения вопрос зависимости или независимости величин S (t- 4) и I(t ) в различные моменты времени t . От решения этого вопроса зависит, как выше уже отмечалось, конкретная реализация процедуры метода наименьших квадратов.

С другой стороны, в модели (1) всего 3 неизвестных параметра, и постановку метода наименьших квадратов выписать нетрудно:

Проблема идентифицируемости. Представим теперь модель тапа (1) с большим числом эндогенных и экзогенных переменных, с лагами и сложной внутренней структурой. Вообще говоря, ниоткуда не следует, что существует хотя бы одно решение у такой системы. Поэтому возникает не одна, а две проблемы. Есть ли хоть одно решение (проблема идентифицируемости)? Если да, то как найти наилучшее решение из возможных? (Это - проблема статистической оценки параметров.)

И первая, и вторая задача достаточно сложны. Для решения обеих задач разработано множество методов, обычно достаточно сложных, лишь часть из которых имеет научное обоснование. В частности, достаточно часто пользуются статистическими оценками, не являющимися состоятельными (строго говоря, их даже нельзя назвать оценками).

Коротко опишем некоторые распространенные приемы при работе с системами линейных эконометрических уравнений.

Система линейных одновременных эконометрических уравнений. Чисто формально можно все переменные выразить через переменные, зависящие только от текущего момента времени. Например, в случае уравнения (1) достаточно положить

H (t ) = I (t- 1), G (t) = S (t- 4).

Тогда уравнение примет вид

I (t ) = с H (t ) + a + bG (t ) + e . (2)

Отметим здесь же возможность использования регрессионных моделей с переменной структурой путем введения фиктивных переменных. Эти переменные при одних значениях времени (скажем, начальных) принимают заметные значения, а при других - сходят на нет (становятся фактически равными 0). В результате формально (математически) одна и та же модель описывает совсем разные зависимости.

Косвенный, двухшаговый и трехшаговый методы наименьших квадратов. Как уже отмечалось, разработана масса методов эвристического анализа систем эконометрических уравнений. Они предназначены для решения тех или иных проблем, возникающих при попытках найти численные решения систем уравнений.

Одна из проблем связана с наличием априорных ограничений на оцениваемые параметры. Например, доход домохозяйства может быть потрачен либо на потребление, либо на сбережение. Значит, сумма долей этих двух видов трат априори равна 1. А в системе эконометрических уравнений эти доли могут участвовать независимо. Возникает мысль оценить их методом наименьших квадратов, не обращая внимания на априорное ограничение, а потом подкорректировать. Такой подход называют косвенным методом наименьших квадратов.

Двухшаговый метод наименьших квадратов состоит в том, что оценивают параметры отдельного уравнения системы, а не рассматривают систему в целом. В то же время трехшаговый метод наименьших квадратов применяется для оценки параметров системы одновременных уравнений в целом. Сначала к каждому уравнению применяется двухшаговый метод с целью оценить коэффициенты и погрешности каждого уравнения, а затем построить оценку для ковариационной матрицы погрешностей. После этого для оценивания коэффициентов всей системы применяется обобщенный метод наименьших квадратов.

Менеджеру и экономисту не следует становиться специалистом по составлению и решению систем эконометрических уравнений, даже с помощью тех или иных программных систем, но он должен быть осведомлен о возможностях этого направления эконометрики, чтобы в случае производственной необходимости квалифицированно сформулировать задание для специалистов по прикладной статистике.

От оценивания тренда (основной тенденции) перейдем ко второй основной задаче эконометрики временных рядов - оцениванию периода (цикла).

Предыдущая