Экстраполяция и интерполяция
При прогнозировании важное значение имеет диапазон данных. Если в диапазоне данных отсутствуют точки данных, для прогнозирования отсутствующих значений используются интерполяция и экстраполяция.
Рассмотрим пример прогнозирования продаж лимонада, чтобы наглядно объяснить понятия интерполяции и экстраполяции. Он также показывает риски, связанные с экстраполяцией, о которых важно знать. На графике показаны продажи лимонада в долларах в зависимости от максимальной дневной температуры. Здесь видно, что продажи растут с повышением температуры.
Данные были собраны только для дней с температурой от 70 (21 °С) до 90 (32 °C) градусов по Фаренгейту. Это означает, что диапазон данных или интервал составляет 70–90 °F.
Интерполяция
Интерполяция — это когда прогнозирование выполняется между известными значениями или в заданном интервале для данных для обучения. В этом примере отсутствуют данные о продажах в день с температурой 77 °F (25 °С). Значение 77 находится в диапазоне 70–90, поэтому прогнозирование продаж в этот день будет считаться интерполяцией.
Допустим, нам необходимо спрогнозировать продажи на завтра, если температура поднимется до 77 °F. Линия тренда на графике представляет собой прогноз модели машинного обучения для любой заданной температуры. При температуре 77 °F модель спрогнозировала продажи в размере 67 долларов.
Экстраполяция
Экстраполяция означает, что прогнозирование выполняется за пределами известных значений или вне заданного интервала для данных для обучения. У нас также нет данных о продажах за день с максимальной температурой ниже 70 °F (21 °С) или выше 90 °F (32 °C). Прогнозирование продаж для дней с температурой ниже 70 °F или выше 90 °F считается экстраполяцией.
Чтобы спрогнозировать продажи в местоположении или сезоне с более высокой или более низкой температурой, необходимо экстраполировать данные на 65 °F (18 °C) и 95 °F (35 °C). Для прогнозирования значений можно снова использовать линию тренда, продлив ее за пределы интервала.
Проблема экстраполяции
При экстраполяции возникает вопрос, действительно ли линия тренда продолжается за пределами имеющихся данных. В данном примере модель спрогнозировала рост продаж в более жаркую погоду, так, может, стоит начать продавать лимонад в Аризоне, где температура воздуха достигает 100 °F (38 °C)? Продолжат ли продажи расти, как показано на графике ниже?
Допустим, мы установили лимонадный киоск в Аризоне и зафиксировали данные о продажах. Оказалось, что покупатели предпочитают оставаться дома, когда становится слишком жарко, и поэтому продажи не выросли, а резко упали! Проблема экстраполяции заключается в том, что закономерность не всегда остается неизменной. В примере с лимонадным киоском экстраполяция привела к плохому бизнес-результату.
Как экстраполировать график
Argument ‘Topic id’ is null or empty
Сейчас на форуме
© Николай Павлов, Planetaexcel, 2006-2023
info@planetaexcel.ru
Использование любых материалов сайта допускается строго с указанием прямой ссылки на источник, упоминанием названия сайта, имени автора и неизменности исходного текста и иллюстраций.
ООО «Планета Эксел» ИНН 7735603520 ОГРН 1147746834949 | ИП Павлов Николай Владимирович ИНН 633015842586 ОГРНИП 310633031600071 |
Онлайн калькулятор расчета линейной экстраполяции по 2 точкам с выводом формулы решения и графика.
Калькулятор линейной экстраполяции позволяет вычислить значение линейной функции если абсцисса (Х) искомой точки лежит за пределами отрезка интерполяции [X1, X2].
Абсцисса первой точки X1 =
Ордината первой точки Y1 =
Абсцисса второй точки X2 =
Ордината второй точки Y2 =
Абсцисса искомой точки X =
округление до знаков после запятой
Решение:
Формула линейной экстраполяции
- Для проведения экстраполяции требуется ввести значения координат 2 точек ([X1, Y1]; [X2, Y2]) и абсциссу (Х) той точки, значение которой необходимо вычислить.
- График справа позволяет визуализировать полученный линейной экстраполяцией результат.
интерполяция — способ нахождения промежуточных значений величины по имеющемуся дискретному набору известных значений. линейная интерполяция — нахождение промежуточного значения функции по двум точкам (условно проведя прямую между ними). квадратичная интерполяция — нахождение промежуточного значения функции по трем точкам (интерполирующая функция многочлен второго порядка — парабола). экстраполяция — способ нахождения значений функции по уже известным нескольким ее значениям.
Научная электронная библиотека
При формировании прогнозов с помощью экстраполяции обычно исходят из статистически складывающихся тенденций изменения тех или иных количественных характеристик объекта. Экстраполируются оценочные функциональные системные и структурные характеристики. Экстраполяционные методы являются одними из самых распространенных и наиболее разработанных среди всей совокупности методов прогнозирования.
С помощью этих методов экстраполируются количественные параметры больших систем, количественные характеристики экономического, научного, производственного потенциала, данные о результативности научно-технического прогресса, характеристики соотношения отдельных подсистем, блоков, элементов в системе показателей сложных систем и др.
Однако степень реальности такого рода прогнозов и соответственно мера доверия к ним в значительной мере обусловливаются аргументированностью выбора пределов экстраполяции и стабильностью соответствия «измерителей» по отношению к сущности рассматриваемого явления. Следует обратить внимание на то, что сложные объекты, как правило, не могут быть охарактеризованы одним параметром. В связи с этим можно сделать некоторое представление о последовательности действий при статистическом анализе тенденций и экстраполировании, которое состоит в следующем:
— во-первых, должно быть четкое определение задачи, выдвижение гипотез о возможном развитии прогнозируемого объекта, обсуждение факторов, стимулирующих и препятствующих развитию данного объекта, определение необходимой экстраполяции и её допустимой дальности;
— во-вторых, выбор системы параметров, унификация различных единиц измерения, относящихся к каждому параметру в отдельности;
— в-третьих, сбор и систематизация данных. Перед сведением их в соответствующие таблицы еще раз проверяется однородность данных и их сопоставимость: одни данные относятся к серийным изделиям, а другие могут характеризовать лишь конструируемые объекты;
— в-четвертых, когда вышеперечисленные требования выполнены, задача состоит в том, чтобы в ходе статистического анализа и непосредственной экстраполяции данных выявить тенденции или симптомы изменения изучаемых величин. В экстраполяционных прогнозах особо важным является не столько предсказание конкретных значений изучаемого объекта или параметра в таком-то году, сколько своевременное фиксирование объективно намечающихся сдвигов, лежащих в зародыше назревающих тенденций.
Для повышения точности экстраполяции используются различные приемы. Один из них состоит, например, в том, чтобы экстраполируемую часть общей кривой развития (тренда) корректировать с учетом реального опыта развития отрасли-аналога исследований или объекта, опережающих в своем развитии прогнозируемый объект.
Под трендом понимается характеристика основной закономерности движения во времени, в некоторой мере свободной от случайных воздействий. Тренд — это длительная тенденция изменения экономических показателей. При разработке моделей прогнозирования тренд оказывается основной составляющей прогнозируемого временного ряда, на которую уже накладываются другие составляющие. Результат при этом связывается исключительно с ходом времени. Предполагается, что через время можно выразить влияние всех основных факторов.
Под тенденцией развития понимают некоторое его общее направление, долговременную эволюцию. Обычно тенденцию стремятся представить в виде более или менее гладкой траектории.
Анализ показывает, что ни один из существующих методов не может дать достаточной точности прогнозов на 20-25 лет. Применяемый в прогнозировании метод экстраполяции не дает точных результатов на длительный срок прогноза, потому что данный метод исходит из прошлого и настоящего, и тем самым погрешность накапливается. Этот метод дает положительные результаты на ближайшую перспективу прогнозирования тех или иных объектов не более 5 лет.
Для нахождения параметров приближенных зависимостей между двумя или несколькими прогнозируемыми величинами по их эмпирическим значениям применяется метод наименьших квадратов. Его сущность состоит в минимизации суммы квадратов отклонений между наблюдаемыми (фактическими) величинами и соответствующими оценками (расчетными величинами), вычисленными по подобранному уравнению связи.
Этот метод лучше других соответствует идее усреднения как единичного влияния учтенных факторов, так и общего влияния неучтенных.
Рассмотрим простейшие приемы экстраполяции. Операцию экстраполяции в общем виде можно представить в виде определения значения функции:
где — экстраполируемое значение уровня; L – период упреждения; Уt – уровень, принятый за базу экстраполяции.
Под периодом упреждения при прогнозировании понимается отрезок времени от момента, для которого имеются последние статистические данные об изучаемом объекте, до момента, к которому относится прогноз.
Экстраполяция на основе среднего значения временного ряда. В самом простом случае при предположении о том, что средний уровень ряда не имеет тенденции к изменению или если это изменение незначительно, можно принятьт.е. прогнозируемый уровень равен среднему значению уровней в прошлом.
Доверительные границы для средней при небольшом числе наблюдений определяются следующим образом:
где ta – табличное значение t – статистики Стьюдента с n-1 степенями и уровнем вероятности p;- средняя квадратическая ошибка средней величины. Значение ее определяется по формуле . В свою очередь, среднее квадратическое отклонение для выборки равно:
где yt – фактические значения показателя.
Доверительный интервал, полученный как ta, учитывает неопределенность, которая связана с оценкой средней величины.
Общая дисперсия, связанная как с колеблемостью выборочной средней, так и с варьированием ндивидуальных значений вокруг средней, составит величину S 2 +S 2 /n. Таким образом, доверительные интервалы для прогностической оценки равны:
Экстраполяция по скользящей и экспоненциальной средней. Для краткосрочного прогнозирования наряду с другими приемами могут быть применены адаптивная или экспоненциальная скользящие средние. Если прогнозирование ведется на один шаг вперед, то или , где Мt — адаптивная скользящая средняя; Nt — экспоненциальная средняя. Здесь доверительный интервал для скользящей средней можно определить по формуле (2.10), в которой число наблюдений обозначено символом n. Поскольку при расчете скользящей средней через m обозначалось число членов ряда, участвующих в расчете средней, то заменим в этой формуле n на m, равным нечетным числам.
При экспоненциальном сглаживании дисперсия экспоненциальной средней равна , где S -среднее квадратическое отклонение, вместо величины в формуле (2.10) при исчислении доверительного интервала прогноза следует взять величину или . Здесь a— коэффициент экспоненциального сглаживания, изменяется от 0 до 1. Если 0a<0,5, то при расчете прогноза учитываются прошлые значения временного ряда, а при 0,5a
где m – число уровней временного ряда, входящих в интервал сглаживания.
Экстраполяция на основе среднего темпа. Если в основу прогностического расчета положен средний темп роста, то экстраполируемое значение уровня можно получить с помощью формулы: , где — средний темп роста, Уt — уровень, принятый за базу для экстраполяции. Здесь принят только один путь развития — развитие по геометрической прогрессии, или по экспонентной кривой. Во многих же случаях фактическое развитие явления следует иному закону, и экстраполяция по среднему темпу нарушает основное допущение, принимаемое при экстраполяции, — допущение о том, что развитие будет следовать основной тенденции — тренду, наблюдавшемуся в прошлом. Чем больше фактический тренд отличается от экспоненты, тем больше данные, получаемые при экстраполяции тренда, будут отличаться от экстраполяции на основе среднего темпа.
Средний темп или определяется на основе изучения прошлого, или оценивается каким-либо другим путем (например, подбор вариантов для различных ситуаций). В качестве исходного (базового) уровня для экстраполяции представляется естественным взять последний уровень ряда, поскольку будущее развитие начинается именно с этого уровня.
Статистическая надежность вышеприведенных методов оценивается с помощью коэффициента вариации:
где- среднее квадратическое отклонение;
— среднее значение временного ряда.
Метод считается статистически надежным и может быть использован для прогнозирования, если значение коэффициента вариации не превышает 10%.
Однофакторные прогнозирующие функции
Это такие функции, в которых прогнозируемый показатель зависит только от одного факториального признака.
В научно-техническом и экономическом прогнозировании в качестве главного фактора аргумента обычно используют время. Вполне очевидно, что не ход времени определяет величины прогнозируемого показателя, а действие многочисленных влияющих на него факторов. Однако каждому моменту времени соответствуют определенные характеристики всех этих факториальных признаков, которые со временем в той или иной мере изменяются. Таким образом, время можно рассматривать как интегральный показатель суммарного воздействия всех факториальных признаков.
В качестве фактора-аргумента в однофакторной прогнозирующей функции можно использовать не только время, но и другие факторы, если известна их количественная оценка на перспективу.
Наиболее простым из методов прогнозирования является экстраполяция тренда явления (процесса) за истекший период. Тренд (или вековая тенденция) характеризует процесс изменения показателя за длительное время, исключая случайные колебания. Тренд явления находят путем аппроксимации фактических уровней временного ряда на основе выбранной функции. Наиболее часто применяемые при прогнозировании функции показаны в табл. 2.3. В них фактор-аргумент обозначен символом t.
Таблица 2.3 Однофакторные прогнозирующие функции