Как создать собственный рейтинг городов РФ методом DEA?

12/12/2012
Подписка RSS

бенчмаркинг, DEA, data envelopment analysis
В данном методе рассмотрен современный непараметрический подход к оценке эффективности объектов, применяемый в экономике, логистике, военном деле и государственном управлении.

Большинство проектов оптимизации цепочки поставок включают этап диагностики, на котором собираются операционные показатели для сравнения с «лучшими мировыми практиками». Так, берётся показатель доли идеально отгруженных заказов и сравнивается с тем же показателем в сравнительной группе компаний, далее анализируется показатель затрат на один заказ, сравниваемый с показателем конкурентов и, например, анализируется гибкость реакции компаний на колебания спроса. Все эти показатели рассматриваются независимо друг от друга, предполагая, что в каждой конкретной компании они не взаимосвязаны. В реальности, предприятие с высоким уровнем сервиса может тратить на выполнение заказов значительные суммы и не обладать такой же гибкостью, как компании с низким уровнем сервиса.

На практике это означает, что классический бенчмаркинг чаще всего недооценивает рассматриваемую компанию, сравнивая её отдельные показатели с лучшими в отрасли (т.е. с искусственно выведенной «лучшей» компанией). С одной стороны, эта ситуация удобна для консультантов и топ-менеджмента, предоставляя «неоспоримые аргументы» для установки недостижимых целей в системе мотивации. С другой стороны, результаты такого анализа не дают полной картины сравнительной эффективности и не позволяют выяснить, на какие компании-конкуренты необходимо ориентироваться в первую очередь.

Рассмотрим другой случай бенчмаркинга, когда основанием для сравнения становится информация о средних значениях параметров. В этой ситуации мы можем получить представление об отклонении рассматриваемого объекта от некоторой виртуальной «средней» компании, не существующей в природе. Рассматриваемый вариант по информативности отличается от предыдущего случая в худшую сторону, т.к. не даёт понимания, какие цели следует устанавливать для развития и каких пределов эффективности можно достигнуть.

Описанная проблема сравнительного анализа эффективности рассматривалась в работе британского экономиста М. Фаррелла (1957), и через 20 лет, Чарнсом-Куперсом-Родсом был сформулирован подход, называемый в русскоязычной литературе анализом обволакивающей границы (data envelopment analysis, DEA). Метод DEA позволяет определить границу относительной возможной эффективности объектов, называемых Модулями Принятия Решений (decision making units, DMU). Лучший МПР из выборки будет находиться на вычисленной границе (т.е. его эффективность будет равна 100%), а все остальные МПР будут к нему приближаться в той или иной мере, имея эффективность от 0 до 100%.

Рассмотрим упрощённый пример задачи определения относительной эффективности трёх складов:

  • Склад А, в котором 10 доков, в сутки обрабатывается 1000 палет и совершаются 20 отгрузок
  • Склад Б: 10 доков, 400 палет, и 50 отгрузок
  • Склад В: 10 доков 200 палет, 150 мелких отгрузок

Возникает вопрос, существует ли такой виртуальны склад, полученный путём линейного комбинирования характеристик складов А, Б или В, превосходящий по своим характеристикам эти склады?

Для склада А рассматриваемый виртуальный склад должен использовать не больше 10 доков, а обрабатывать не менее 1000 палет и 20 фур. Комбинируя в различных пропорциях возможности складов Б и В добиться эффективности склада А не представляется возможным. Совсем иная ситуация со складом Б. Если сконструировать виртуальный склад из половинок складов А и В, то 5+5 доков смогут переваливать 1000/2+200/2=600 палет и отгружать 20/2+150/2=85 машин в сутки, что превосходит по своим характеристикам склад Б. Для склада В ситуация аналогична складу А – он эффективен на 100%. Рассмотренная ситуация означает, что склады А и В находятся на границе эффективности, а склад Б к ней стремится и его эффективность ниже 100 процентов. Чтобы вычислить эффективность склада Б мы должны понять, в каких «пропорциях» нам необходимо «смешать» склады А и В, чтобы получить эффективность Б. Методом подбора можно посчитать, что для того, чтобы получить выходную мощность склада Б, нужно взять 0,34 склада А и 0,29 склада В. Таким образом 6,3 виртуальных доков А и В обеспечивают эффективность 10 доков склада Б. Это означает, что сравнительная эффективность склада Б составляет 63% от эффективных на 100% складов А и В.  

В данном случае под эффективностью мы понимаем эффективность распределения по Фарреллу, т.е. способность тратить минимум ресурсов для производства одного и того же объёма продукции. Второй тип эффективности – техническая эффективность или различие в объёмах выпуска при одной и той же ресурсоёмкости в данном примере не рассматривается.

Графически представленный пример со складами означает следующее: склады А и В находятся на линейной границе эффективности, задаваемой уравнением  13•x + 80 •y  – 14600 = 0, где x – число палет, а y – число отгруженных машин.

Склад Б находится внутри границы эффективности и если провести прямую из точки начала координат через точку, соответствующую этому складу, то она пересечёт границу эффективности в точке V. Отношение расстояний OБ/OV = 63% , будет соответствовать относительной эффективности склада Б.  Таким образом, решение задачи анализа относительной эффективности будет состоять из двух этапов:

  • Нахождения границы сравнительной эффективности
  • Нахождения относительной эффективности каждого МПР путём определения радиального расстояния от МПР до границы эффективности

Рассматриваемую задачу решают методом линейного программирования. Одна из возможных формулировок для каждого МПР, выглядит следующим образом:

\[\min \theta \] \[s.t. \sum{\lambda_iXi}\le\theta X_o \] \[\sum{\lambda_i Yi}\ge Y_o\] \[\lambda\ge0\]

Где λi– вес, присваиваемый каждому МПР, а θ– уровень эффективности, X0 – входы, Y0 – выходы сравниваемого МПР. Переменными в задаче выступают λ и θ. Следует иметь в виду, что входы и выходы МПР0 присутствуют как в левой, так и правой части неравенств. Из-за этого отпадает необходимость вводить ограничение значений эффективности в диапазоне от 0 до 1.

В качестве примера попробуем построить рейтинг городов РФ на основе данных портала Numbeo, где приведены различные макроэкономические показатели жизни в городах мира на основе данных от пользователей интернет. В качестве 10 исходных городов взяты лучшие мегаполисы РФ по версии последнего на момент написания статьи рейтинга «Русского репортёра».

ГородМесто по РРGIRRICPR+RIЗарплата
Краснодар48.4 62.04 43.02 30000
Екатеринбург253.5  62.9345.25 29548
Ростов-на-Дону352.447.9345.1627500
Красноярск462.1 61.86 ?25000
Хабаровск5?119.2?24500
Казань654.775.0748.8921703
Новосибирск75771.0252.7620000
Уфа864.8 50.76 22500
Пермь964.963.942.8622000
Ярославль 1010????
В среднем по РФ 57.4 72.93  48.0322000

 В рассмотренной таблице приведены данные по следующим индексам (в % от аналогичного показателя в Нью-Йорке)

  • GI – Groceries Index (индекс цен на овощи в магазинах)
  • RRI – Restaurants Index (индекс цен в ресторанах)
  • CPR + RI – Consumer Price + Rent Index (индекс покупательской способности, включая индекс стоимости аренды жилья)

В качестве входов МПР мы будем рассматривать макроэкономические индексы, а в качестве выхода выступит среднемесячная зарплата после уплаты налогов. Ярославль в базе Numbeo отсутствует, поэтому он рассматриваться не будет. Для Хабаровска в базе отсутствуют данные по двум параметрам из трёх, в связи с чем он из дальнейших расчётов выпадает. Все неизвестные параметры будут заменены на средние по РФ.

В качестве инструмента реализации используем среду Gusek, где в одном из файлов стандартной поставки имеется пример для решения задач методом DEA (dea.mod). На базе этого файла подготовим модель, запустим расчёт и проанализируем показатели. В результате выполненного расчёта получаем следующую таблицу:

ГородМесто по РРЭффективностьМесто по DEA
Краснодар11,001/2
Екатеринбург2 0,953
Ростов-на-Дону31,001/2 
Красноярск40,794
Казань50,647
Новосибирск60,578
Уфа70,775
Пермь80,746

Основное перераспределение мест затронуло среднюю и нижнюю часть рейтинга, в то время, как верхние позиции рейтинга остались практически неизменными.

Итак, основные плюсы рассматриваемого метода:

  • возможность оценки для множества входных и выходных параметров;
  • не требуется знания функциональной взаимосвязи между входами и выходами;
  • входы и выходы могут задаваться в самых разнообразных единицах.

К основным минусам относятся:

  • в связи с тем, что DEA базируется на оценке экстремальных значений, любые шумы, ошибки и искажения могут значительно повлиять на конечный результат;
  • метод позволяет дать сравнительную оценку объектов друг относительно друга, но не позволяет оценить теоретическую достижимую границу эффективности;
  • метод ресурсоёмок и для задач большого объёма требует значительных вычислительных мощностей;
  • в стандартной формулировке не учитываются эффекты масштаба и нелинейные связи между входами и выходами, но существуют модели DEA, учитывающие такие эффекты;
  • для сложных типов параметров (логических, ступенчатых) требует применения специальных доработок.

Где метод применяется? Из наиболее близкой тематики можно привести примеры базы данных специалистов Georgia Institute of Technology, разработавших методологию оценки эффективности складских комплексов на основе DEA. В отечественной литературе есть работы, посвящённые сравнительной оценке эффективности портовых комплексов, эффективности управления компаниями и банками. В западной литературе выполнялись оценки военных подразделений, государственных учреждений и коммерческих предприятий.