Как экстраполировать график
Перейти к содержимому

Как экстраполировать график

Экстраполяция и интерполяция

При прогнозировании важное значение имеет диапазон данных. Если в диапазоне данных отсутствуют точки данных, для прогнозирования отсутствующих значений используются интерполяция и экстраполяция.

Рассмотрим пример прогнозирования продаж лимонада, чтобы наглядно объяснить понятия интерполяции и экстраполяции. Он также показывает риски, связанные с экстраполяцией, о которых важно знать. На графике показаны продажи лимонада в долларах в зависимости от максимальной дневной температуры. Здесь видно, что продажи растут с повышением температуры.

График зависимости продаж от температуры.

Данные были собраны только для дней с температурой от 70 (21 °С) до 90 (32 °C) градусов по Фаренгейту. Это означает, что диапазон данных или интервал составляет 70–90 °F.

Интерполяция

Интерполяция — это когда прогнозирование выполняется между известными значениями или в заданном интервале для данных для обучения. В этом примере отсутствуют данные о продажах в день с температурой 77 °F (25 °С). Значение 77 находится в диапазоне 70–90, поэтому прогнозирование продаж в этот день будет считаться интерполяцией.

График зависимости продаж от температуры с линией на отметке 77 градусов.

Допустим, нам необходимо спрогнозировать продажи на завтра, если температура поднимется до 77 °F. Линия тренда на графике представляет собой прогноз модели машинного обучения для любой заданной температуры. При температуре 77 °F модель спрогнозировала продажи в размере 67 долларов.

График зависимости продаж от температуры с прогнозным значением для 77 градусов.

Экстраполяция

Экстраполяция означает, что прогнозирование выполняется за пределами известных значений или вне заданного интервала для данных для обучения. У нас также нет данных о продажах за день с максимальной температурой ниже 70 °F (21 °С) или выше 90 °F (32 °C). Прогнозирование продаж для дней с температурой ниже 70 °F или выше 90 °F считается экстраполяцией.

Чтобы спрогнозировать продажи в местоположении или сезоне с более высокой или более низкой температурой, необходимо экстраполировать данные на 65 °F (18 °C) и 95 °F (35 °C). Для прогнозирования значений можно снова использовать линию тренда, продлив ее за пределы интервала.

График зависимости продаж от температуры с прогнозными значениями для 65 и 95 градусов.

Проблема экстраполяции

При экстраполяции возникает вопрос, действительно ли линия тренда продолжается за пределами имеющихся данных. В данном примере модель спрогнозировала рост продаж в более жаркую погоду, так, может, стоит начать продавать лимонад в Аризоне, где температура воздуха достигает 100 °F (38 °C)? Продолжат ли продажи расти, как показано на графике ниже?

График зависимости продаж от температуры с прогнозными значениями для высоких температур.

Допустим, мы установили лимонадный киоск в Аризоне и зафиксировали данные о продажах. Оказалось, что покупатели предпочитают оставаться дома, когда становится слишком жарко, и поэтому продажи не выросли, а резко упали! Проблема экстраполяции заключается в том, что закономерность не всегда остается неизменной. В примере с лимонадным киоском экстраполяция привела к плохому бизнес-результату.

Как экстраполировать график

Argument ‘Topic id’ is null or empty

Сейчас на форуме

© Николай Павлов, Planetaexcel, 2006-2023
info@planetaexcel.ru

Использование любых материалов сайта допускается строго с указанием прямой ссылки на источник, упоминанием названия сайта, имени автора и неизменности исходного текста и иллюстраций.

ООО «Планета Эксел»
ИНН 7735603520
ОГРН 1147746834949
ИП Павлов Николай Владимирович
ИНН 633015842586
ОГРНИП 310633031600071

Онлайн калькулятор расчета линейной экстраполяции по 2 точкам с выводом формулы решения и графика.

Калькулятор линейной экстраполяции позволяет вычислить значение линейной функции если абсцисса (Х) искомой точки лежит за пределами отрезка интерполяции [X1, X2].

Абсцисса первой точки X1 =

Ордината первой точки Y1 =

Абсцисса второй точки X2 =

Ордината второй точки Y2 =

Абсцисса искомой точки X =

округление до знаков после запятой

Решение:

Формула линейной экстраполяции

  1. Для проведения экстраполяции требуется ввести значения координат 2 точек ([X1, Y1]; [X2, Y2]) и абсциссу (Х) той точки, значение которой необходимо вычислить.
  2. График справа позволяет визуализировать полученный линейной экстраполяцией результат.

интерполяция — способ нахождения промежуточных значений величины по имеющемуся дискретному набору известных значений. линейная интерполяция — нахождение промежуточного значения функции по двум точкам (условно проведя прямую между ними). квадратичная интерполяция — нахождение промежуточного значения функции по трем точкам (интерполирующая функция многочлен второго порядка — парабола). экстраполяция — способ нахождения значений функции по уже известным нескольким ее значениям.

Научная электронная библиотека

При формировании прогнозов с помощью экстраполяции обычно исходят из статистически складывающихся тенденций изменения тех или иных количественных характеристик объекта. Экстраполируются оценочные функциональные системные и структурные характеристики. Экстраполяционные методы являются одними из самых распространенных и наиболее разработанных среди всей совокупности методов прогно­зирования.

С помощью этих методов экстраполируются количественные параметры больших систем, количественные характеристики экономического, научного, производственного потенциала, данные о результа­тивности научно-технического прогресса, характеристики соотношения отдельных подсистем, блоков, элементов в системе показателей сложных систем и др.

Однако степень реальности такого рода прогнозов и соответ­ственно мера доверия к ним в значительной мере обусловливаются аргументированностью выбора пределов экстраполяции и стабиль­ностью соответствия «измерителей» по отношению к сущности рас­сматриваемого явления. Следует обратить внимание на то, что слож­ные объекты, как правило, не могут быть охарактеризованы одним параметром. В связи с этим можно сделать некоторое представление о последовательности действий при статистическом анализе тенден­ций и экстраполировании, которое состоит в следующем:

— во-первых, должно быть четкое определение задачи, выдвиже­ние гипотез о возможном развитии прогнозируемого объекта, обсуж­дение факторов, стимулирующих и препятствующих развитию данного объекта, определение необходимой экстраполяции и её допустимой дальности;

— во-вторых, выбор системы параметров, унификация различных единиц измерения, относящихся к каждому параметру в отдельности;

— в-третьих, сбор и систематизация данных. Перед сведением их в соответствующие таблицы еще раз проверяется однородность дан­ных и их сопоставимость: одни данные относятся к серийным изде­лиям, а другие могут характеризовать лишь конструируемые объекты;

— в-четвертых, когда вышеперечисленные требования выполнены, задача состоит в том, чтобы в ходе статистического анализа и не­посредственной экстраполяции данных выявить тенденции или симп­томы изменения изучаемых величин. В экстраполяционных прогнозах особо важным является не столько предсказание конкретных значе­ний изучаемого объекта или параметра в таком-то году, сколько своевременное фиксирование объективно намечающихся сдвигов, ле­жащих в зародыше назревающих тенденций.

Для повышения точности экстраполяции используются различные приемы. Один из них состоит, например, в том, чтобы экстраполи­руемую часть общей кривой развития (тренда) корректировать с уче­том реального опыта развития отрасли-аналога исследований или объекта, опережающих в своем развитии прогнозируемый объект.

Под трендом понимается характеристика основной закономер­ности движения во времени, в некоторой мере свободной от случай­ных воздействий. Тренд — это длительная тенденция изменения эко­номических показателей. При разработке моделей прогнозирования тренд оказывается основной составляющей прогнозируемого времен­ного ряда, на которую уже накладываются другие составляющие. Ре­зультат при этом связывается исключительно с ходом времени. Пред­полагается, что через время можно выразить влияние всех основ­ных факторов.

Под тенденцией развития понима­ют некоторое его общее направление, долговременную эволюцию. Обычно тенденцию стремятся представить в виде более или менее гладкой траектории.

Анализ показывает, что ни один из существующих методов не может дать достаточной точности прогнозов на 20-25 лет. Применяе­мый в прогнозировании метод экстраполяции не дает точных резуль­татов на длительный срок прогноза, потому что данный метод исхо­дит из прошлого и настоящего, и тем самым погрешность накапли­вается. Этот метод дает положительные результаты на ближайшую перспективу прогнозирования тех или иных объектов не более 5 лет.

Для нахождения параметров приближенных зависимостей между двумя или несколькими прогнозируемыми величинами по их эмпиричес­ким значениям применяется метод наименьших квадратов. Его сущ­ность состоит в минимизации суммы квадратов отклонений меж­ду наблюдаемыми (фактическими) величинами и соответствующими оценками (расчет­ными величинами), вычисленными по подобранному уравнению связи.

Этот метод лучше других соответствует идее усреднения как единичного влияния учтенных факторов, так и общего влияния неуч­тенных.

Рассмотрим простейшие приемы экстраполяции. Операцию экстра­поляции в общем виде можно представить в виде определения значе­ния функции:

где — экстраполируемое значение уровня; L – период упреждения; Уt – уровень, принятый за базу экстраполяции.

Под периодом упреждения при прогнозировании понимается от­резок времени от момента, для которого имеются последние статис­тические данные об изучаемом объекте, до момента, к которому относится прогноз.

Экстраполяция на основе среднего значения временного ряда. В самом простом случае при предположении о том, что средний уровень ряда не имеет тенденции к изменению или если это изменение незначительно, можно принятьт.е. прогнозируемый уровень равен среднему значению уровней в прошлом.

Доверительные границы для средней при небольшом числе на­блюдений определяются следующим образом:

где ta – табличное значение t – статистики Стьюдента с n-1 степенями и уровнем вероятности p;- средняя квадратическая ошибка средней величины. Значение ее определяется по формуле . В свою очередь, среднее квадратическое отклонение для выборки равно:

где yt – фактические значения показателя.

Доверительный интервал, полученный как ta, учитывает неопределенность, которая связана с оценкой средней величины.

Общая дисперсия, связанная как с колеблемостью выборочной средней, так и с варьированием ндивидуальных значений вокруг средней, составит величину S 2 +S 2 /n. Таким образом, доверительные интервалы для прогностической оценки равны:

Экстраполяция по скользящей и экспоненциальной средней. Для краткосрочного прогнозирования наряду с другими приемами могут быть применены адаптивная или экспоненциальная скользящие сред­ние. Если прогнозирование ведется на один шаг вперед, то или , где Мt — адаптивная скользящая средняя; Nt — экспоненциальная средняя. Здесь доверительный интервал для скользящей средней можно определить по формуле (2.10), в которой число наблюдений обозначено символом n. Поскольку при расчете скользящей средней через m обозначалось число членов ряда, участвующих в расчете средней, то заменим в этой фор­муле n на m, равным нечетным числам.

При экспоненциальном сглаживании дисперсия экспоненциальной средней равна , где S -среднее квадратическое отклонение, вместо величины в фор­муле (2.10) при исчислении доверительного интервала прогноза следует взять величину или . Здесь a— коэффициент экспоненциального сглаживания, изменяется от 0 до 1. Если 0a<0,5, то при расчете прогноза учитываются прошлые значения временного ряда, а при 0,5a

где m – число уровней временного ряда, входящих в интервал сглаживания.

Экстраполяция на основе сред­него темпа. Если в основу прогностического расчета положен средний темп роста, то экстраполируемое значение уровня можно получить с помощью формулы: , где — средний темп роста, Уt — уровень, принятый за базу для экстра­поляции. Здесь принят только один путь развития — развитие по геометрической прогрессии, или по экспонентной кривой. Во мно­гих же случаях фактическое развитие явления следует иному зако­ну, и экстраполяция по среднему темпу нарушает основное допуще­ние, принимаемое при экстраполяции, — допущение о том, что раз­витие будет следовать основной тенденции — тренду, наблюдавшему­ся в прошлом. Чем больше фактический тренд отличается от экспоненты, тем больше данные, получаемые при экстраполяции тренда, будут отличаться от экстраполяции на основе среднего темпа.

Средний темп или определяется на основе изучения прошлого, или оценивается каким-либо другим путем (например, подбор вари­антов для различных ситуаций). В качестве исходного (базового) уровня для экстраполяции представляется естественным взять по­следний уровень ряда, поскольку будущее развитие начинается имен­но с этого уровня.

Статистическая надежность вышеприведенных методов оценивается с помощью коэффициента вариации:

где- среднее квадратическое отклонение;

— среднее значение временного ряда.

Метод считается статистически надежным и может быть использован для прогнозирования, если значение коэффициента вариации не превышает 10%.

Однофакторные прогнозирующие функции

Это такие функции, в которых прогнозируемый показатель зависит только от одного факториального признака.

В научно-техническом и экономическом прогнозировании в качестве главного фактора аргумента обычно используют время. Вполне очевидно, что не ход времени определяет величины прогнозируемого показателя, а действие многочисленных влияющих на него факторов. Однако каждому моменту времени соответствуют определенные характеристики всех этих факториальных признаков, которые со временем в той или иной мере изменяются. Таким образом, время можно рассматривать как интегральный показатель суммарного воздействия всех факториальных признаков.

В качестве фактора-аргумента в однофакторной прогнозирующей функции можно использовать не только время, но и другие факторы, если известна их количественная оценка на перспективу.

Наиболее простым из методов прогнозирования является экстраполяция тренда явления (процесса) за истекший период. Тренд (или вековая тенденция) характеризует процесс изменения показателя за длительное время, исключая случайные колебания. Тренд явления находят путем аппроксимации фактических уровней временного ряда на основе выбранной функции. Наиболее часто применяемые при прогнозировании функции показаны в табл. 2.3. В них фактор-аргумент обозначен символом t.

Таблица 2.3 Однофакторные прогнозирующие функции

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *