Санкт-Петербургский государственный политехнический университет
Физико-механический факультет
Кафедра «Прикладная математика»
Работа допущена к защите
Зав. кафедрой
________________В.Е. Клавдиев
«___»_______________2012 г.
ВЫПУСКНАЯ РАБОТА БАКАЛАВРА
Тема: «Анализ и прогнозирование снятия денежных средств через банковские автоматы«
Направление: 010400 — Прикладная математика и информатика
Выполнил студент гр.4057/3 Р.Р. Колчаков
Руководитель, аспирант А.Ю. Серов
Санкт-Петербург
2012
Оглавление
- Введение
- 1. Обзор основных направлений и подходов при прогнозировании снятия денежных средств через банковские автоматы
- 2. Ядерное оценивание регрессии, медианы и моды
- 2.1 Основные определения
- 2.2 Постановка задачи непараметрического оценивания
- 2.3 Ядерное сглаживание
- 2.4 Ядерные оценки регрессии, медианы и моды
- 2.5 Вычисление полуметрики
- 2.6 Выбора ширины окна
- 2.7 Непараметрическое прогнозирование временных рядов
- 3. Прогнозирование снятия денежных средств через банковские автоматы
- 3.1 Данные по потокам снятия денежных средств
- 3.2 Очистка от периодических колебаний
- 3.3 Прогнозирование снятия денежных средств
- Заключение
- Библиографический список
Введение
Практически все современные банки используют широкую сеть банковских автоматов. Наличие такой сети ставит перед ними проблему снижения недополученной прибыли из-за неработающих активов в виде денежной наличности, находящейся в банкомате, и расходов на его инкассацию [5].
Попытка уменьшить количество инкассаций, загружая в банкомат максимально допустимую сумму наличных, приводит к тому, что банк не может рационально использовать денежную наличность. С другой стороны, недостаток купюр в банкомате, возникший вследствие несвоевременной инкассации или несогласованной работы инкассаторской службы может спровоцировать снижения уровня доверия клиентов к банку [1].
Одна из важнейших задач анализа и прогнозирования движения денег в банкоматных системах состоит в определении резерва наличности, необходимого для подкрепления банкоматов в течение определенного календарного времени [1]. Модель движения наличности в банкомате должна дать возможность прогнозировать расход денег за заданный интервал времени с целью исключения дефицита наличности, необходимой для обеспечения банкоматных операций [4].
Целью данной работы является разработка эффективного статистического метода прогнозирования снятия денежных средств, через банковские банкоматы основанного на непараметрическом оценивании. В главе 1 рассматривается степень изученности проблемы. В главе 2 представлен один из наиболее известных методов непараметрического оценивания — ядерный метод для оценки регрессии среднего, медианы и моды. В главе 3 рассматривается качественное исследование реальных данных по двум банковским банкоматам за 11 месяцев. Также в этой главе производится сравнительный анализ ядерных методов и некоторых параметрических методов.
1. Обзор основных направлений и подходов при прогнозировании снятия денежных средств через банковские автоматы
По проблеме исследования проанализируем труды как отечественных, так и зарубежных ученых.
Для решения задачи прогнозирования снятия денежных средств через банковские автоматы Васиным Н.С. было предложено статистическое моделирование процесса функционирования банкомата. При этом банкомат был представлен как система массового обслуживания. Моделировались как поток клиентов, так и денежный поток. Статистическое моделирование проводилось также для того, чтобы учесть особенности реальных стохастических характеристик потока клиентов и денежного потока, которые, в общем случае существенно зависят как от времени суток, так и от дня недели и месяца. Поэтому при моделировании потока клиентов предполагалось, что поток пуассоновский, но его интенсивность зависит от времени. Длительность обслуживания клиентов моделировалась логнормальным распределением, а величина денежной суммы операции — гамма- распределением.
С помощью разработанной модели был определен интервал времени, за который суммарный расход денег впервые превысит заданный.
Другой подход основан на применении методов с использованием алгоритмов машинного обучения. В рамках данного подхода, группой ученых во главе с Рындиным А.А., была предложена модель нейронной сети с одним скрытым слоем. При этом выдвигалось предположение, что расход средств в банкомате в каждый из M дней в будущем косвенным образом зависит от того, какой это день — рабочий, предпраздничный или праздничный, а также от дня недели и числа месяца. Также предполагалась зависимость прогноза от значений расхода средств в банкомате за M предшествующих дней и M дней того же месяца в прошлом году. Для обучения нейронной сети использовался метод обучения «с учителем». В результате проведенного исследования получена нейронная сеть, которая может быть использована для прогнозирования расхода средств в банкомате на M дней вперед.
Аналогичный подход проиллюстрирован в статье, написанной группой ученных во главе с Симутисом Р., при прогнозировании спроса денежных средств банковского автомата. Однако, наряду с методом построения нейронной сети, в данной работе для сравнения приведен и иной метод с использованием алгоритма машинного обучения. Это, так называемый, метод регрессии опорных векторов. При этом в качестве ядерной функции использовалась радиальная базисная функция. В ходе проведённого сравнительного анализа обоих методов, метод, основанный на построении нейронной сети, оказался немногим лучше.
Для прогнозирования снятия денежных средств применяют также эвристические приемы. Так в своем диссертационном исследовании Делино Й. предложил использовать адаптивную модель Хольта-Уинтерса. Данная модель учитывает аддитивную сезонность, что позволяет взять в расчет годовую, месячную, недельную сезонности.
2. Ядерное оценивание регрессии, медианы и моды
2.1 Основные определения
Определение 2.1.1 является полунормой на некотором пространстве , если:
1) ,
2) .
Определение 2.1.2 является полуметрикой на некотором пространстве , если:
1) ,
2) .
Под будем в дальнейшем понимать пары векторов независимых и одинаково распределенных с .
2.2 Постановка задачи непараметрического оценивания
Обозначим за соответствующий скалярный отклик.
Для того чтобы оценить отклик , будем использовать условное распределение при = . При этом избегая параметрических предположений о функциональной форме связи и .
Рассмотрим регрессию среднего:
, (2.2.1)
и условную функцию распределения:
. (2.2.2)
Если является абсолютно непрерывной функцией, то существует — функция плотности распределения:
. (2.2.3)
Таким образом, для получения скалярного отклика можем использовать три варианта подхода. Первый подход заключается в оценивании регрессии среднего:
, (2.2.4)
где является оценкой . Второй подход заключается в оценивании медианы условной функции распределения :
, (2.2.5)
где является оценкой для медианы условной функции распределения . Медиана условной функции распределения имеет вид:
(2.2.6)
Наконец, третий подход заключается в оценивании моды условной функции плотности :
, (2.2.7)
где является оценкой для моды условной функции плотности . Мода условной функции плотности распределения имеет вид:
. (2.2.8)
В определении (2.4.8) неявно предполагается, что существует на .
2.3 Ядерное сглаживание
Идейно простой подход к представлению последовательности весов состоит в описании формы весовой функции посредством функции плотности со скалярным параметром , который регулирует размер и форму весов около . Эту функцию формы принято называть ядром [9].
Ядро — ограниченная, вещественная функция с единичным интегралом:
. (2.3.1)
Если не указанно иное, в формуле (2.3.1) нижним и верхним пределами будут и соответствено. Скалярный параметр называют шириной окна.
Последовательность весов для ядерных оценок определяется как [13]:
. (2.3.2)
Обычно в качестве ядерных функций рассматривают следующие функции [10]:
Равномерное ядро:
, (2.3.3)
Треугольное ядро:
, (2.3.4)
Епанечниково ядро:
, (2.3.5)
Гауссово (нормальное) ядро:
. (2.3.6)
Следует отметить, что областью определения первых трех ядер является отрезок [-1,1], в то время как последнее имеет бесконечный носитель. Следовательно, при использовании равномерного, треугольного или Епанечникова ядра оценка будет использовать информацию в ограниченном окне в окрестности , а оценка, использующая гауссово ядро, будет использовать информацию из всех наблюдений [10]. На рисунке 3 представлены графики данных ядерных функций.
Рис. 3 Графики некоторых симметричных ядерных функций
Для сглаживания в многомерном случае применяют следующие два подхода. Первый подход заключается в использовании одномерных ядер [9]:
. (2.3.7)
Второй подход заключается в использовании полунормы в [8]:
. (2.3.8)
При использовании второго подхода весовая функция преобразуется к виду:
, (2.3.9)
где — полуметрика в .
Поскольку не отрицательная величина, ядерная функция также должна быть неотрицательной. Это приводит нас к необходимости использования асимметричных ядерных функций. Для рассмотренных выше одномерных симметричных ядерных функций соответствующие одномерные асимметричные ядерные функции имеют вид:
Асимметричное равномерное ядро:
,(2.3.10)
Асимметричное треугольное ядро:
,(2.3.11)
Асимметричное Епанечниково ядро:
,(2.3.12)
Асимметричное Гауссово (нормальное) ядро:
.(2.3.13)
На рисунке 4 представлены графики данных ядерных функций.
Рис. 4 Графики некоторых асимметричных ядерных функций
2.4 Ядерные оценки регрессии, медианы и моды
Используем теперь ядерное сглаживание для получения оценок регрессии, медианы и моды.
Ядерная оценка регрессии [13]:
, (2.4.1)
где асимметричная ядерная функция, — ширина окна, — полуметрика. Оценку (2.4.1) называют оценкой Надарая-Ватсона.
Для получения оценок медианы и моды, оценим условную функцию распределения и условную плотность распределения из параграфа (2.2).
Ядерная оценка условной функции распределения [13]:
,(2.4.2)
где — индикаторная функция.
Ядерная оценка условной функции плотности [13]:
.(2.4.3)
Используя ядерные оценки (2.4.2) и (2.4.3) можно определить соответствующие оценки для медианы и моды:
(2.4.4)
. (2.4.5)
2.5 Вычисление полуметрики
На практике, в случае, когда — дискретизированные кривые на равномерной сетке с шагом . Полуметрика и может быть вычислена следующим образом [8]:
, (2.5.1)
где — значение собственного вектора с номером эмпирической матрицы ковариации:
. (2.5.2)
2.6 Выбора ширины окна
Ключом к проведению качественного непараметрического оценивания является выбор подходящей ширины окна для имеющейся задачи. Хотя ядерная функция остается важной, ее главная роль состоит в обеспечении дифференцируемости и гладкости получающихся оценок. Ширина окна, другой стороны, определяет поведение оценки в конечных выборках, что ядерная функция сделать просто не в состоянии [11].
Оптимальная ширина окна может быть найдена следующим образом [8]:
, (2.6.1)
где определяется как:
, (2.6.2)
а
. (2.6.3)
2.7 Непараметрическое прогнозирование временных рядов
Существуют некоторые ограничения на возможность изучения большого массива данных. Условия эксперимента могут быть невоспроизводимыми из-за разрушения рассматриваемого объекта. Бюджетные ограничения или причины этического характера также могут заставить экспериментатора провести единственный эксперимент [9].
Рассмотрим временной ряд . Пусть наблюдется до времени и требуется найти будущее значение временного ряда .
Предположим, что рассматриваемый временной ряд имеет периодические колебания. Причем, период этих колебаний равен . Пусть , для некоторого . Тогда мы можем построить статистическую выборку объемом следующим образом [8]:
. (2.7.1)
3. Прогнозирование снятия денежных средств через банковские автоматы
3.1 Данные по потокам снятия денежных средств
Рассмотрим данные за период 09.08 — 07.09 по потокам снятия денежных средств двух банковских автоматов. Для определенности будем называть первый банковский автомат ATM 1, второй — ATM 2. На рисунке 5 представлен график временного ряда для данных по АТМ 1. Соответствующий график временного ряда для данных по АТМ 2 приведен на рисунке 6. Графики данных временных рядов свидетельствуют о наличии горизонтальной тенденции в каждом из потоков снятий денежных средств.
Рис. 5 Данные по снятиям денежных средств через ATM 1
Рис. 6 Данные по снятиям денежных средств через ATM 2
3.2 Очистка от периодических колебаний
Проведем более детальный анализ данных по потокам снятий денежных средств.
На рисунке 7 и представлены данные за сентябрь и октябрь 2008 года, соответствующие ATM 1, отложенные на одних осях. Аналогичный график представлен на рисунке 8 для ATM 2.
Рис. 7 Выявление периодических месячных колебаний для данных по ATM 1
Рис. 8 Выявление периодических месячных колебаний для данных по ATM 2
На основании графиков, представленных на рисунках 7 и 8, можно сделать вывод о достаточно схожей динамике между данными за сентябрь и октябрь в соответствующих данных.
На рисунке 9 (рисунке 10) представлен график автокорреляционной функции, построенной по данным ATM 1 (ATM 2).
Рис. 9 График автокорреляционной функции, построенной по данным ATM 1. Величина лага указана в часах
Рис. 10 График автокорреляционной функции, построенной по данным ATM 2. Величина лага указана в часах
На основании графиков автокорреляционных функций, представленных на рисунках 9 и 10, можно сделать следующие выводы о данных по банковским банкоматам ATM 1 и ATM 2:
1) В данных имеется линейная тенденция;
2) В данных имеются периодические колебания. Причем период этих колебаний равен одному месяцу.
На рисунке 11 (рисунке 12) представлен временной ряд для АТМ 1 (АТМ 2) очищенный от периодических месячных колебаний. Данный временной ряд был найден как разность между фактическими и теоретическими уровнями ряда. Теоретические значения найдены путем ядерного оценивания регрессии среднего — непараметрического метода рассмотренного в главе 2.
Рис. 11 Временной ряд для ATM 1, очищенный от сезонных месячных колебаний
Рис. 12 Временной ряд для ATM 2, очищенный от сезонных месячных колебаний
Проведем более детальный анализ временных рядов очищенных от месячных сезонных колебаний.
На рисунке 13 и представлены данные за периоды 01.09.08 — 07.09.08 и 08.09.08 — 14.09.08, соответствующие ATM 1, отложенные на одних осях. Аналогичный график представлен на рисунке 14 для ATM 2.
Рис. 13 Выявление периодических недельных колебаний для данных по ATM 1
Рис. 14 Выявление периодических недельных колебаний для данных по ATM 2
оценивание банковский автомат прогнозирование
Анализ графиков, представленных на рисунках 13 и 14, свидетельствует о схожей динамике в соответствующих временных рядах, очищенных от месячной сезонности.
На рисунке 15 (рисунке 16) представлен график автокорреляционной функции, построенной по очищенным от месячных сезонных колебаний данным ATM 1 (ATM 2).
Рис. 15 График автокорреляционной функции, построенной по данным ATM 1. Величина лага указана в часах
Рис. 16 График автокорреляционной функции, построенной по данным ATM 2. Величина лага указана в часах
На основании графиков автокорреляционных функций, представленных на рисунках 15 и 16, можно сделать следующие выводы о данных очищенных от месячных сезонных колебаний:
1) В данных имеется линейная тенденция;
2) В данных имеются периодические колебания. Причем период этих колебаний равен одной недели.
Очистка от периодических недельных колебаний может быть выполнена аналогично очищению от сезонных месячных колебаний исходных временных рядов.
3.3 Прогнозирование снятия денежных средств
В предыдущем параграфе были установлены периодические колебания в данных по потокам снятий денежных средств через ATM 1 и ATM 2. Используя данных колебания, спрогнозируем будущие значения потока снятий денежных средств некоторыми параметрическими и непараметрическими методами.
В качестве непараметрических методов используем методы, приведенные в главе 2. Причем при ядерном оценивании, будем последовательно брать в качестве ядерных функций Епанечниково, Гауссово, треугольное и равномерное ядра.
Для иллюстрации параметрических методов, приведем методы с использованием аддитивной и мультипликативной моделей.
Общий вид аддитивной модели имеет следующий [14]:
(3.3.1)
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой (T), сезонной (S) и случайной (E) компонент.
Общий вид мультипликативной модели выглядит так [14]:
(3.3.2)
Детальное изучение параметрических методов, в том числе и рассматриваемых, оставим за рамками данной работы. Поясним лишь некоторые особенности применения аддитивной и мультипликативной моделей. Расчет значений сезонной компоненты в обеих моделях может быть выполнен двумя подходами. Первый подход заключается в оценке сезонной компоненты как разность между фактическими уровнями ряда и их центрированными скользящими средними. Второй подход заключается в расчете сезонной компоненты как разность между фактическими уровнями ряда и их аппроксимацией рядом Фурье.
На рисунке 17 (рисунке 18) приведены дисперсии остатков, полученных различными методами для данных по ATM 1 (ATM 2). Каждая дисперсия была вычислена от разности между спрогнозированными на одну неделю значениями и наблюдаемыми данными за эту неделю.
Рис. 17 Дисперсии остатков для АТМ 1:
1 — аддитивная модель (сезонная компонента вычислена по центрированной скользящей средней); 2 — аддитивная модель (сезонная компонента вычислена по аппроксимации рядом Фурье); 3 — мультипликативная модель (сезонная компонента вычислена по центрированной скользящей средней); 4 — мультипликативная модель (сезонная компонента вычислена по аппроксимации рядом Фурье); 5 — оценка регрессии среднего (ассиметричное Епанечниково ядро); 6 — оценка регрессии среднего (ассиметричное Гауссово ядро); 7 — оценка регрессии среднего (ассиметричное треугольное ядро), 8 — оценка медианы (ассиметричное равномерное ядро); 9 — оценка медианы (ассиметричное Епанечниково ядро); 10 — оценка медианы (ассиметричное Гауссово ядро); 11 — оценка медианы (ассиметричное треугольное ядро); 12 — оценка медианы (ассиметричное равномерное ядро); 13 — оценка моды (ассиметричное равномерное ядро); 14 — оценка моды (ассиметричное Епанечниково ядро); 15 — оценка моды (ассиметричное Гауссово ядро); 16 — оценка моды (ассиметричное треугольное ядро).
Рис. 18 Дисперсии остатков для ATM 2:
1 — аддитивная модель (сезонная компонента вычислена по центрированной скользящей средней); 2 — аддитивная модель (сезонная компонента вычислена по аппроксимации рядом Фурье); 3 — мультипликативная модель (сезонная компонента вычислена по центрированной скользящей средней); 4 — мультипликативная модель (сезонная компонента вычислена по аппроксимации рядом Фурье); 5 — оценка регрессии среднего (ассиметричное Епанечниково ядро); 6 — оценка регрессии среднего (ассиметричное Гауссово ядро); 7 — оценка регрессии среднего (ассиметричное треугольное ядро), 8 — оценка медианы (ассиметричное равномерное ядро); 9 — оценка медианы (ассиметричное Епанечниково ядро); 10 — оценка медианы (ассиметричное Гауссово ядро); 11 — оценка медианы (ассиметричное треугольное ядро); 12 — оценка медианы (ассиметричное равномерное ядро); 13 — оценка моды (ассиметричное равномерное ядро); 14 — оценка моды (ассиметричное Епанечниково ядро); 15 — оценка моды (ассиметричное Гауссово ядро); 16 — оценка моды (ассиметричное треугольное ядро).
Анализируя диаграммы, представленные на рисунках 17 и 18 можно прийти выводу о том, что метод оценки моды с ассиметричным равномерным ядром является лучшим среди рассмотренных методов. На рисунках 19, 20, 21 и 22 представлены некоторые прогнозные данные и наблюдаемые данные.
Рис. 19 Данные по снятиям денежных средств через ATM 1 за период 1.08.09 — 7.08.09 (наблюдаемые и спрогнозированные по аддитивной модели с центрированной скользящей средней)
Рис. 20 Данные по снятиям денежных средств через ATM 1 за период 1.08.09 — 7.08.09 (наблюдаемые и спрогнозированные путем оценивания моды, с ассиметричным равномерным ядром)
Рис. 21 Данные по снятиям денежных средств через ATM 2 за период 1.08.09 — 7.08.09 (наблюдаемые и спрогнозированные по аддитивной модели с аппроксимацией рядом Фурье)
Рис. 22 Данные по снятиям денежных средств через ATM 2 за период 1.08.09 — 7.08.09 (наблюдаемые и спрогнозированные путем оценивания моды, с ассиметричным равномерным ядром)
Заключение
В данной работе представлены некоторое параметрические методы, которые предлагается использовать для прогнозирования будущих значений потока снятий денежных средств через банковские банкоматы.
Сравнительный анализ параметрических и непараметрических методов для построения прогнозных значений показал целесообразность использования непараметрических методов для построения прогнозов по потокам операций снятий денежных средств через банковские банкоматы.
Библиографический список
1 Бояршинов М.Г., Салихова О.С., Оптимальная загрузка автомата денежными купюрами // Вестник Пермского национального исследовательского политехнического университета. — 2010. — №15.
2 В.В. Климов, В.М. Бакланов, И.В. Беклемишев, Система оценки эффективности инкассаций.
3 Васин, Н. С. Анализ и прогнозирование движения денег в банкоматных системах / Н. С. Васин // Автореферат диссертации на соискание ученой степени к. э. н. — 2007.
4 Васин Н.С. Теоретико-вероятностный анализ и прогнозирование резерва наличности для обеспечение банкоматных операций // Финансы и Кредит. — 2005. — № 25 (193). — С. 68-70.
5 Рындин А.А., Демиденков А.А., Минаков С.В. Формализация оптимизационной модели расчета денежных средств для загрузки в устройства самообслуживания // Вестник Воронежского государственного технического yниверситета. — 2009. — №3.
6 Simutis R., Dilijonas D., Bastina L. Cash demand forecasting for ATM using neural networks and support vector regression algorithms // EurOPT’ 2008, May 20-23, 2008, Neringa, Lithuania: selected papers. Vilnius. p. 416-421.
7 Delyno Johannes du Toit. ATM Cash Management for a South African Retail Bank // Stellenbosch : Stellenbosch University, 2011.
8 Ferraty F., Vieu P. Nonparametric Functional Data Analysis: Theory and Practice // New York: Springer-Verlag, 2006.
9 Хардле В. Прикладная непараметрическая регрессия: Пер. с англ. // Москва: Мир, 1993.
10 Анатольев, Станислав (2009) «Непараметрическая регрессия», Квантиль, №7, стр. 37-52.
11 Расин, Джеффри (2008) «Непараметрическая эконометрика: вводный курс», Квантиль, №4, стр. 7-56.
12 The Indian Journal of Statistics, 2011, Volume 73-A, Part 1, pp. 125-141.
13 Journal of Forecasting, 2000, pp. 335-353.
14 И.И. Елисеева, Эконометрика // Москва: Финансы и статистика, 2003.