Методы улучшения бизнес-процессов
Методы улучшения бизнес-процессов на основе теории массового обслуживания и дискретно-событийной симуляции. Каждая оптимизация содержит формулы, пошаговые инструкции и рекомендации по применению.
С чего начать?
5 базовых методов для новичковС чего начать?
5 базовых методов для новичковОбъединить ресурсы
Оптимизация батчей
Снизить вариабельность
Теория ограничений
Сгладить пики
Сглаживание по часам
Снизить поток
Увеличить поток
Расширить часы
Сократить простой
Добавить ресурсы
Оптимальный штат (√)
Перебалансировать нагрузку
Планирование мощностей
Сократить ресурсы
Анализ ожидания
Оптимальная загрузка
Точка бифуркации
Динамическое ценообразование
Комбо экономика
Оптимальный размер партии
Повысить цену
Снизить стоимость привлечения
Стоимость задержки
Улучшить конверсию
Буферизация
Оптим. скорость μ*
CONWIP-система
Вытягивающая система
Ограничение WIP
Закон Литтла
Критический путь
Формула Эрланга
Изменить развилку
Обход узкого места
Усилить ранний отсев
What-If анализ
Прогноз спроса
Резерв мощности
Защита от ошибок
Оптимальные точки контроля
С первого раза правильно
Приоритизация очереди
Разделить потоки
Снизить переделки
Управление буферами (TOC)
Автоматизировать задачу
Объединить задачи
Параллелизовать задачи
Перенести фильтр в начало
Удалить задачу
Ускорить задачу
Сегментация процесса
Быстрая переналадка
Группировка переналадок
Коэффициент касания
Барабан
DrumВ методе DBR — ресурс-ограничение (bottleneck), который задаёт ритм всей системы. Пропускная способность процесса = пропускная способность Drum. Все остальные этапы подстраиваются под его темп.
Барабанщик на галере задаёт ритм гребцам. Быстрее, чем он отбивает, корабль не поплывёт — неважно, сколько гребцов добавить.
Батч/Партия
BatchГруппа заявок, обрабатываемых вместе. Большие батчи экономят setup time, но увеличивают время ожидания.
Как стирка: экономнее копить бельё и стирать раз в неделю, но отдельные вещи ждут дольше.
Бережливое производство
LeanМетодология Toyota: устранение потерь (muda), снижение вариабельности, непрерывное улучшение (kaizen).
Как уборка в квартире: выбросить лишнее, разложить по местам, поддерживать порядок.
Буфер
BufferЗапас работы перед ресурсом для защиты от вариабельности. По TOC — буфер перед ограничением критичен.
Как запас деталей на складе перед станком: если поставщик задержится — станок не встанет.
Буфер
BufferВ методе DBR — временной запас работы перед узким местом (Drum). Защищает Drum от простоя из-за случайных задержек на предыдущих этапах. Drum не должен простаивать ни секунды — это самый дорогой ресурс в системе.
Небольшая корзинка с деталями перед самым загруженным станком. Если предыдущий станок задержится, загруженный станок всё равно продолжит работать из корзинки.
Быстрая переналадка
SMEDSingle-Minute Exchange of Die — методология сокращения времени переналадки до однозначного числа минут (<10 мин). Разделяет операции на внутренние (при остановке) и внешние (на ходу).
Пит-стоп в Формуле-1: всё готово заранее, замена колёс за секунды вместо минут.
Вариабельность обслуживания
CsКоэффициент вариации времени обслуживания. Cs = σs / x̄s. Показывает стабильность времени обработки.
Как разброс времени приёма у врача: у терапевта всегда ~15 мин (Cs≈0), у хирурга от 30 мин до 3 часов (Cs≈1).
Вариабельность потока
CaКоэффициент вариации входящего потока. Ca = σa / x̄a. Показывает, насколько неравномерно приходят заявки.
Как разброс времени прихода автобусов: если автобус ходит точно по расписанию — Ca≈0, если когда попало — Ca≈1.
Верёвка
RopeВ методе DBR — сигнал от узкого места (Drum) к началу процесса: не запускать новую работу быстрее, чем Drum может обработать. Ограничивает WIP (незавершённое производство) и предотвращает перегрузку системы.
Верёвка между передним и задним туристом в горах. Передний не может убежать вперёд — иначе группа растянется и потеряется.
Вероятностное распределение
РаспределениеМатематическая модель, описывающая, какие значения величина принимает и с какой вероятностью. В DES-симуляции распределения задают времена обработки, интервалы между событиями и другие случайные параметры.
Это как «портрет» процесса: курьер доставляет за 8–12 минут, но иногда за 5, иногда за 20. Распределение описывает эту картину целиком — не одним числом, а полным «портретом» всех возможных вариантов.
Верхняя граница спецификации
USLUpper Specification Limit — максимально допустимое значение, установленное SLA или стандартом. Например, если SLA обещает доставку за 45 минут — USL = 45 мин. Всё что выше — нарушение.
Как дедлайн: можно сдать раньше, но позже — уже провал.
Взвешенная кратчайшая работа
WSJFWeighted Shortest Job First — метод приоритизации: WSJF = Cost of Delay / Duration. Задачи с высоким WSJF выполняются первыми. Минимизирует суммарные потери от задержек.
Если два пожара, тушите сначала тот, где больше ущерб в минуту и быстрее потушить.
Время выполнения
Lead TimeВремя от поступления заявки до её завершения. Включает все ожидания и обработку. Lead Time = W.
Как срок доставки пиццы: от заказа до звонка в дверь, включая очередь в пекарне и дорогу.
Время касания
Touch TimeВремя, когда над заявкой реально работают (добавляют ценность). Touch Time Ratio = Touch Time / Lead Time. Типичное значение 1-5%, цель >10%.
Из 5 дней доставки посылки, её реально несут может 2 часа. Остальное — ожидание.
Время ожидания
WqСреднее время, которое заявка проводит в очереди до начала обработки.
Как долго вы стоите в очереди в банке, пока вас не позовут к окошку. Это время ожидания до начала обслуживания. Чем длиннее очередь и медленнее кассир, тем больше Wq.
Время переналадки
Setup TimeВремя подготовки ресурса к обработке нового типа заявки. Влияет на оптимальный размер батча.
Как время настройки станка под новую деталь: долгая настройка → лучше делать большими партиями.
Время полного цикла (Turn Around Time)
TATОбщее время от поступления заявки до выдачи готового результата. Включает обработку, ожидание в очереди и календарные паузы (нерабочие часы, выходные).
Сдали анализ крови в субботу утром, результат получили в понедельник вечером — TAT = 58 часов, хотя сама лабораторная работа заняла 2 часа.
Время пребывания
WСреднее время нахождения заявки в системе — сумма времени ожидания и времени обслуживания. W = Wq + 1/μ
Как общее время похода в поликлинику: сидение в очереди + сам приём у врача.
Время такта
Takt TimeТемп, с которым нужно выпускать продукцию, чтобы удовлетворить спрос. Takt Time = Доступное время / Спрос. Задаёт ритм производства.
Если за 8 часов нужно сделать 48 деталей, такт = 10 минут на деталь. Это пульс производства.
Время цикла
Cycle TimeВ контексте теории очередей (Flow Time, W) — полное время пребывания заявки в системе: ожидание в очереди + обработка. В производстве cycle time часто означает чистое время обработки без очереди, а в Lean — интервал между выпуском последовательных единиц (1/Throughput). В этом квизе используется определение из теории очередей.
Как время от заказа пиццы до её получения: включает ожидание в очереди, готовку и доставку — всё время от входа в систему до выхода.
Вытягивающая система
Pull SystemСистема, где работа начинается по сигналу от downstream (следующего этапа), а не по плану сверху. Противоположность push-системы. Основа Kanban и JIT.
Супермаркет: полки пополняются когда товар забрали, а не по расписанию.
Выход годных с первого раза
FPYFirst Pass Yield — доля изделий (или заказов), которые прошли этап правильно с первого раза, без переделок и возвратов. FPY = Годные / Всего. Например, если из 100 заказов 5 пришлось переделать — FPY = 95%.
Как процент студентов, сдавших экзамен с первой попытки — без пересдач.
Дискретно-событийная симуляция
DESDiscrete Event Simulation — метод моделирования, где система меняется только в дискретные моменты времени (события).
Как виртуальный стенд для тестирования процесса: можно 'прожить' год работы за минуты.
Доля безупречных заказов
Perfect Order RateКомплексная метрика, объединяющая качество и своевременность: Perfect Order Rate = RTY × SLA compliance. Показывает долю заказов, выполненных без дефектов И доставленных вовремя. Стандартный KPI в supply chain и логистике.
Вы заказали пиццу. Если она приехала правильная, но через 2 часа — это не безупречный заказ. Если быстро, но перепутали начинку — тоже. Безупречный = правильный + вовремя.
Доступность
AvailabilityДоля времени, когда оборудование или ресурс действительно работает, а не простаивает из-за поломок, переналадок или ожидания. Availability = Рабочее время / Плановое время. Например, если из 8-часовой смены кухня простаивала 1.2 часа — Availability = 85%.
Как посещаемость сотрудника: сколько дней из рабочих он реально на месте.
Закон Литтла
Little's LawФундаментальный закон теории очередей: L = λ × W. Среднее число заявок в системе = интенсивность × среднее время пребывания.
Как число людей в магазине = сколько входит в час × сколько часов каждый проводит внутри.
Защита от ошибок
Poka-YokeЯпонская концепция встраивания механизмов предотвращения ошибок в процесс. Три типа: предотвращающие (делают ошибку невозможной), обнаруживающие (сигнализируют об ошибке), смягчающие (минимизируют последствия).
USB-порт, который нельзя вставить неправильно — это Poka-Yoke. Невозможно ошибиться физически.
Заявка
RequestЕдиница работы, проходящая через систему: заказ, клиент, документ, деталь. В DES-симуляции заявка — это сущность (entity), которая создаётся источником, проходит через очереди и ресурсы, и покидает систему после обработки. Среднее число заявок в системе — L, скорость поступления — λ.
Покупатель в магазине — это заявка. Он входит, встаёт в очередь, обслуживается на кассе и уходит. Всё, что мы считаем (время ожидания, загрузку касс, длину очереди) — это характеристики потока заявок.
Индекс способности процесса
CpkИндекс способности процесса. Cpk = min(Cpu, Cpl), где Cpu = (USL − x̄) / (3σ) — верхний, Cpl = (x̄ − LSL) / (3σ) — нижний. При наличии только USL (как SLA на время) Cpk = Cpu. Если Cpk ≥ 1.33 — процесс стабильно выдерживает спецификацию. Cpk ≥ 1.0 — на грани. Cpk < 1.0 — процесс НЕСПОСОБЕН.
Как зазор между машиной и стенами гаража: Cpk > 1 — есть запас, Cpk < 1 — царапаете бока.
Интенсивность
IntensityСкорость поступления заявок в систему, выраженная как среднее количество заявок за единицу времени (λ). Также употребляется как «интенсивность потока» или «интенсивность нагрузки». Определяет входную нагрузку на систему: чем выше интенсивность при тех же ресурсах — тем длиннее очереди.
Интенсивность — это «напор» потока. Как сильный поток воды из крана: чем сильнее напор (больше λ), тем быстрее переполняется раковина (растёт очередь).
Интенсивность потока
λСреднее количество заявок, поступающих в систему за единицу времени.
Представьте кассу в супермаркете. λ — это сколько покупателей в среднем встаёт в очередь за час. Если λ = 20, значит каждые 3 минуты приходит новый покупатель.
Канбан
KanbanМетод управления потоком работ с визуализацией и WIP-лимитами. Основные принципы: визуализируй работу, ограничь WIP, управляй потоком, делай правила явными.
Доска с колонками «Сделать», «В работе», «Готово» и ограничением: в колонке «В работе» максимум 3 задачи.
Карта потока ценности
VSMValue Stream Mapping — визуализация всех этапов процесса с временами и запасами. Показывает потери.
Как карта путешествия заявки: где она ждёт, где обрабатывается, где застревает.
Качество
QualityДоля продукции (или услуг), выполненных правильно с первого раза, без переделок и брака. Quality = Годные изделия / Общий выпуск. Если из 78 заказов 9 переделали — Quality ≈ 88%.
Как процент сданных с первого раза экзаменов — без пересдач.
Количество ресурсов
nЧисло параллельных серверов/ресурсов, обрабатывающих заявки. Влияет на пропускную способность и утилизацию.
Как число касс в магазине: больше касс — короче очередь, но выше затраты.
Конверсия
ConversionДоля заявок, перешедших на следующий этап воронки. Conversion = Успешные / Всего × 100%.
Как процент посетителей магазина, которые что-то купили.
Коэффициент вариации
CVОтношение стандартного отклонения (σ) к среднему (x̄): CV = σ / x̄. Показывает, насколько "разбросаны" значения относительно среднего. CV = 1 — экспоненциальный хаос, CV < 1 — более предсказуемый процесс.
Представьте двух сотрудников. Оба в среднем делают задачу за 10 минут. Но первый всегда делает за 9-11 мин (CV=0.1, стабильный), а второй — за 2-30 мин (CV=1.0, непредсказуемый).
Коэффициент вариации времени обслуживания
Cs²Квадрат коэффициента вариации времени обслуживания: Cs² = (σs / x̄s)². Показывает, насколько нестабильно время обработки. Cs² = 0 — все заявки обрабатываются одинаково, Cs² = 1 — экспоненциальный разброс. Используется в формуле Кингмана для расчёта времени ожидания в очереди.
Представьте повара. Cs² ≈ 0 — каждое блюдо готовится ровно 10 минут, как на конвейере. Cs² = 1 — иногда 5 минут, иногда 20, полный разброс. Чем больше Cs², тем длиннее очереди.
Коэффициент вариации входного потока
Ca²Квадрат коэффициента вариации входного потока: Ca² = (σa / x̄a)². Показывает, насколько хаотичен поток заявок. Ca² = 1 — пуассоновский поток (полный хаос), Ca² < 1 — более регулярный, Ca² > 1 — сверххаотичный.
Представьте очередь в кафе. Ca² = 0 — клиенты приходят строго каждые 5 минут. Ca² = 1 — приходят случайно, то пусто, то толпа. Ca² > 1 — приходят группами, хаос ещё сильнее.
Коэффициент утилизации
ρДоля времени, которую ресурс занят работой. В теоретических расчетах может превышать 1.
Представьте бак бензина в машине. ρ = 0.85 значит бак заполнен на 85%. При ρ близком к 1 (почти полный бак) любой сбой критичен. Оптимально держать ρ около 70-85%.
Коэффициент SLA
βМультипликатор для расчёта буфера мощности в зависимости от целевого SLA.
Чем выше β, тем больше "подушка безопасности" для системы. Как запасной парашют — чем важнее надёжность, тем больше резерв нужен.
Критический поток
λ_critМаксимальный поток, который система может обработать. λ_crit = μ × n. При λ > λ_crit система нестабильна.
Как максимальная пропускная способность дороги: если машин больше — пробка.
Критический путь
Critical PathСамая длинная цепочка последовательных зависимых задач от начала до конца процесса. Задачи на критическом пути не имеют резерва времени — любая задержка удлиняет весь процесс.
Если для борща нужно сварить бульон (2 часа) и нарезать овощи (20 мин), критический путь — бульон. Ускорение нарезки не поможет.
Метод Монте-Карло
Monte CarloМетод статистического моделирования: многократный запуск симуляции со случайными входами для оценки распределения результатов.
Как бросать кубик 1000 раз, чтобы понять вероятность выпадения каждой грани.
Модель массового обслуживания
M/M/nМодель системы массового обслуживания в нотации Кендалла: M (Markovian) — пуассоновский входящий поток, M — экспоненциальное время обслуживания, n — количество параллельных серверов (каналов обслуживания). Частный случай M/M/1 описывает систему с одним сервером.
Представьте кассы в супермаркете: покупатели приходят случайно (первая M), каждая покупка занимает разное время (вторая M), а n — это сколько касс открыто. M/M/1 — одна касса, M/M/3 — три кассы.
Модель M/M/1
M/M/1 QueueПростейшая модель системы массового обслуживания (СМО) в нотации Кендалла. Первая M — пуассоновский (марковский) входящий поток, вторая M — экспоненциальное время обслуживания, 1 — один сервер (ресурс). Средняя длина очереди: <var>L</var><sub>q</sub> = <span class="frac"><span class="num"><var>ρ</var>²</span><span class="den">1 − <var>ρ</var></span></span>, где <var>ρ</var> = <var>λ</var> / <var>μ</var>. Обобщение на n серверов — модель M/M/n (Эрланг-C).
Представьте одинокий банкомат в торговом центре. Люди подходят случайно (в среднем λ человек в час), каждый тратит случайное время на операцию (в среднем 1/μ минут). Пока загрузка ρ = λ/μ мала (скажем, 0.5), очередь почти не ощущается. Но стоит ρ приблизиться к 1 — и очередь растёт взрывообразно. Это и есть главный урок M/M/1: система ведёт себя нелинейно вблизи полной загрузки.
Модель M/M/c
M/M/cКлассическая модель очереди: M — пуассоновский поток, M — экспоненциальное обслуживание, c — число серверов.
Как базовая модель кассы в магазине: покупатели приходят случайно, время обслуживания разное, касс несколько.
Мощность
CapacityМаксимальное количество заявок, которое система (или ресурс) способна обработать за единицу времени при полной загрузке. Capacity = μ × n, где μ — скорость одного сервера (1/S), n — число серверов. Например, 10 поваров с S = 8 мин дают мощность 10/8 = 1.25 зак/мин. Фактическая (эффективная) мощность ниже номинальной из-за переделок, простоев и вариабельности.
Мощность — это как число полос на шоссе. Каждая полоса пропускает определённое количество машин в час. Больше полос — выше пропускная способность. Но если на одной полосе авария (переделка), реальная пропускная способность падает ниже теоретической.
Незавершённая работа
WIPWork In Progress — количество заявок, находящихся в обработке. По закону Литтла: WIP = λ × W.
Как сколько блюд сейчас готовится на кухне: слишком много — хаос и задержки.
Неравномерность
MuraНеравномерность нагрузки или потока. Пики и провалы спроса создают очереди в пики и простой в провалы. Mura часто является причиной muda: неравномерный поток порождает ожидание.
В DeliverGo в обед (12:00–14:00) поток 120 заказов/час, а в 15:00 — 40. Это mura: повара завалены в пик и скучают между пиками.
Нотация Кендалла
Kendall notationСтандартная запись для описания моделей очередей в формате A/S/n, где A — распределение времени между прибытиями, S — распределение времени обслуживания, n — число серверов. M (Markov) = экспоненциальное, D (Deterministic) = постоянное, G (General) = произвольное. Примеры: M/M/1, M/M/c (Эрланг-C), G/G/1 (Кингман VUT), G/G/c (Sakasegawa).
Как GPS-координаты для очередей: три символа однозначно описывают тип системы массового обслуживания
Общая эффективность оборудования
OEEOverall Equipment Effectiveness = Доступность × Производительность × Качество. Комплексная метрика эффективности использования оборудования. Мировой класс: OEE > 85%.
Если станок работает 80% времени, на 90% скорости и 95% без брака, OEE = 0.8×0.9×0.95 = 68%.
Объединение ресурсов
PoolingСоздание общего пула ресурсов вместо выделенных. Снижает очереди за счёт статистического эффекта.
Как одна очередь ко всем кассам вместо отдельной к каждой: свободная касса сразу берёт следующего.
Оптимальный размер заказа
EOQEconomic Order Quantity — размер партии, минимизирующий суммарные затраты на заказ и хранение. Баланс между частыми мелкими заказами и редкими крупными.
Закупка продуктов: слишком часто — тратите время на магазин, слишком редко — продукты портятся.
Оптимальный штат
n*Расчётное оптимальное количество ресурсов по формуле Square Root Staffing: n* = λ/μ + β×√(λ/μ)
Идеальное число кассиров: и очереди короткие, и кассиры не сидят без дела.
Оценка баланса нагрузки
Balance ScoreМетрика равномерности загрузки ресурсов в процессе. Balance Score = 1 − (σ(ρ) / 0.3). Значение близкое к 1 означает, что все ресурсы загружены одинаково. Близкое к 0 — одни ресурсы перегружены, другие простаивают.
Представьте три кассы: одна завалена на 92%, вторая на 45%, третья на 78%. Нагрузка распределена неравномерно — Balance Score низкий. Если перераспределить людей так, чтобы все были на ~70%, Balance Score вырастет.
Оценка влияния
Impact ScoreКомплексная метрика, показывающая, насколько сильно оптимизация влияет на ключевые показатели процесса: время цикла, стоимость, пропускную способность и утилизацию. Помогает приоритизировать: сначала делаем то, что даёт максимальный эффект.
Как рейтинг фильма на Кинопоиске: одно число, которое учитывает много факторов. Impact Score = 9 значит «эта оптимизация кардинально меняет процесс», Impact Score = 2 — «мелкое улучшение».
Очередь
QueueМесто ожидания заявок перед ресурсом, когда все ресурсы заняты. Длина очереди (Lq) и время ожидания (Wq) зависят от утилизации, вариабельности и числа ресурсов. Очереди возникают математически неизбежно при любой случайности в потоке — даже если средняя загрузка ниже 100%.
Очередь в кассу супермаркета. Даже если кассир в среднем справляется, иногда покупатели приходят пачкой — и очередь растёт. Чем ближе загрузка к 100%, тем длиннее очередь.
Первый пришёл — первый ушёл
FIFOFirst In First Out — базовая дисциплина очереди. Заявки обрабатываются в порядке поступления.
Как очередь в кассу: кто раньше встал — раньше обслужен. Честно, но не всегда эффективно.
Перегрузка
MuriЧрезмерная нагрузка на людей или оборудование. Приводит к ошибкам, поломкам, выгоранию. В DES-модели проявляется как ρ > 85–90%: ресурс работает на пределе, очереди растут экспоненциально.
Кухня DeliverGo с ρ=0.92 — это muri: повара работают на 92% мощности, устают, делают ошибки, еда остывает в очереди. Снизить ρ до 0.75 — убрать muri.
Переделки
ReworkПовторная обработка из-за ошибок. Увеличивает эффективную нагрузку: λ_eff = λ / (1 - p_rework).
Как возврат товара в магазин: один возврат = двойная работа для склада.
Плотность вероятности
Функция, показывающая, насколько вероятно получить значение вблизи конкретной точки. Чем выше кривая на графике — тем чаще встречаются такие значения.
Представьте гистограмму времён доставки за месяц. Плотность — это плавная кривая, которая обводит эту гистограмму: где столбики высокие, там доставки чаще всего занимают именно столько минут.
Пожизненная ценность
LTVLifetime Value — суммарная прибыль от клиента за всё время работы с ним. LTV/CAC > 3 — здоровая экономика.
Как сколько денег принесёт абонент мобильного оператора за годы пользования.
Полезная работа
Value-AddedДеятельность, которая непосредственно создаёт ценность для клиента — то, за что он готов платить. Простой тест: если убрать этот шаг, заметит ли клиент? Если да — это Value-Added. Если нет — потери (muda). Используется для расчёта PCE.
В DeliverGo клиент платит за еду и доставку — готовка (12 мин) и доставка (10 мин) создают ценность, клиент заметит, если их убрать. А ожидание в очереди на кухню (15 мин) — нет: если убрать очередь, клиент только обрадуется. Значит ожидание — не Value-Added, а muda.
Постоянный WIP
CONWIPConstant Work-In-Process — система управления, где общее число заявок в системе фиксировано. Новая заявка входит только когда другая выходит. Комбинирует преимущества push и pull систем.
Лифт с ограничением вместимости: новый пассажир заходит только когда кто-то выходит.
Потери
MudaЛюбая деятельность, которая потребляет ресурсы, но не создаёт ценности для клиента. 8 типов: перепроизводство, ожидание, транспортировка, лишняя обработка, запасы, лишние движения, дефекты, неиспользованный потенциал людей. Одна из трёх категорий потерь в Lean (muda, mura, muri).
В DeliverGo muda — это 20 минут из 42, когда заказ просто ждёт: 15 мин в очереди на кухню, 5 мин ожидание курьера. Клиент не платит за ожидание — это чистые потери.
Правило корня
Square Root StaffingМетод расчёта оптимального штата: n* = λ/μ + β×√(λ/μ). Резерв мощности пропорционален корню из нагрузки.
Как правило для колл-центра: при удвоении звонков не нужно удваивать операторов — достаточно добавить √2 ≈ 1.4 раза больше.
Правило cμ
cμ ruleОптимальная приоритизация: приоритет = c (cost) × μ (speed). Сначала делай быстрые дорогие задачи.
Как выбор задач: если можно быстро заработать много — делай это сначала!
Приоритетная очередь
Priority QueueОчередь с приоритетами: важные заявки обрабатываются раньше. Оптимальная стратегия — правило cμ.
Как скорая помощь: тяжёлых пациентов принимают первыми, даже если они пришли позже.
Производительность
PerformanceОтношение фактической скорости работы к номинальной. Учитывает замедления, микро-остановки и работу не на полной мощности. Performance = Факт. выпуск / Номинальный. Если кухня может 100 заказов/смену, но выдаёт 78 — Performance = 78%.
Как KPI сотрудника: на месте, но работает ли на полную мощность?
Пропускная способность
ThroughputКоличество заявок, фактически выпускаемых системой за единицу времени. Не путать с мощностью (capacity) — максимально возможным выпуском. В стабильной системе throughput = λ (rate входящего потока), но throughput не может превышать capacity.
Как сколько клиентов в час может обслужить кафе: можно увеличить, добавив столики или ускорив обслуживание.
Ресурс
ResourceИсполнитель, обрабатывающий заявки: сотрудник, станок, сервер, транспортное средство. Ресурс характеризуется скоростью обслуживания (μ) и количеством параллельных единиц (n). Утилизация ресурса ρ = λ / (μ × n) показывает, какую долю времени он занят.
Повар на кухне — это ресурс. Он может готовить одно блюдо за раз (n=1). Если поваров пять — это пул ресурсов (n=5). Чем выше загрузка ресурса, тем длиннее очередь перед ним.
С первого раза правильно
FTRFirst Time Right — процент заявок, обработанных правильно с первого раза без переделок. FTR% = (Всего - Переделки) / Всего × 100%. Эффективная мощность системы = μ × FTR%.
Как сдать экзамен с первой попытки: каждая пересдача занимает время и отнимает ресурсы у других.
Сквозной выход годных
RTYRolled Throughput Yield — вероятность того, что изделие пройдёт ВСЕ этапы процесса без единого дефекта. RTY = FPY₁ × FPY₂ × … × FPYₙ. Например, 3 этапа по 95% → RTY = 0.95³ ≈ 86%. Чем больше этапов, тем сильнее падает RTY.
Как вероятность пройти все КПП без задержки: каждый пропускает 95%, но после 5 КПП пройдут только 77%.
Скорость обслуживания
μСреднее количество заявок, которые один ресурс может обработать за единицу времени.
Это как скорость работы кассира. Если μ = 30, кассир успевает обслужить 30 покупателей в час (по 2 минуты на каждого). Чем выше μ, тем быстрее рассасывается очередь.
Соглашение об уровне сервиса
SLAService Level Agreement — договорённость о целевых показателях качества услуги: время доставки, процент успешных операций, время отклика. Например, «95% заказов доставляются за 45 минут» — это SLA.
Как обещание ресторана: «Пицца за 30 минут или бесплатно».
Среднее время обслуживания
T (Service time)Среднее время, которое ресурс тратит на обработку одной заявки. Третий множитель в формуле VUT. Обратная величина к скорости обслуживания: T = 1/μ.
В DeliverGo повар готовит заказ в среднем 8 минут — это T. Чем длиннее T, тем дольше ждут следующие в очереди.
Среднее значение
x̄ (Mean)Среднее арифметическое набора значений — сумма всех значений, делённая на их количество. В теории очередей обозначает средний интервал между заявками или среднее время обслуживания.
Если за час пришло 60 заказов, средний интервал x̄ = 60 мин / 60 = 1 мин между заказами. Но реальные интервалы могут быть от 5 секунд до 5 минут — среднее не показывает разброс.
Среднее число в системе
LСреднее количество заявок, находящихся в системе (в очереди + на обслуживании).
Сколько человек сейчас в банке: и те, кто ждёт в очереди, и те, кого уже обслуживают. Это "запас" работы в системе.
Стандартное отклонение
σМера разброса значений от среднего. σ = √(Σ(x−x̄)²/n). Чем больше σ, тем выше вариабельность процесса.
Как разброс оценок в классе: если все получают 4-5, σ маленькое; если кто-то 2, кто-то 5 — σ большое.
Стоимость задержки
CoDCost of Delay — экономические потери от задержки выполнения задачи, выраженные в ₽/день или ₽/неделю. Используется для приоритизации и обоснования инвестиций в скорость.
Каждый день простоя такси — это недополученная выручка. CoD = сколько денег теряете за день ожидания.
Стоимость привлечения
CACCustomer Acquisition Cost — затраты на привлечение одного клиента. CAC = Затраты на маркетинг / Новые клиенты.
Как стоимость рекламы в пересчёте на одного пришедшего покупателя.
Страховой запас
Safety StockДополнительный запас для защиты от вариабельности спроса и поставок. Рассчитывается на основе целевого уровня сервиса и стандартного отклонения.
Держите дома запас лекарств на случай болезни — это страховой запас.
Теория ограничений
TOCTheory of Constraints — методология Голдратта. Фокус на узком месте: найти → эксплуатировать → подчинить → расширить → повторить.
Как в туристическом походе: скорость группы = скорость самого медленного. Ускорять нужно его, а не быстрых.
Теория очередей
Queueing TheoryМатематическая дисциплина для анализа систем массового обслуживания. Основа для DES-симуляции.
Как наука об очередях: почему они возникают, как их предсказать и уменьшить.
Узкое место
BottleneckРесурс или этап процесса с максимальной загрузкой, ограничивающий пропускную способность всей системы.
Как горлышко бутылки: сколько воды ни наливай, вытечет только столько, сколько пропустит самое узкое место.
Утилизация
UtilizationДоля времени, когда ресурс занят. Utilization = ρ = λ / (μ × n). Оптимум зависит от CV.
Как занятость такси: 70% времени с пассажирами, 30% — ждёт заказ.
Фактор вариативности
V (Variability factor)Множитель в формуле Кингмана (VUT), отражающий совокупный разброс потока и обслуживания. Чем выше V, тем длиннее очереди.
Представьте две кухни с одинаковой загрузкой. На первой все заказы одинаковые (V низкий) — очереди минимальны. На второй салаты и пиццы вперемешку (V высокий) — очереди в разы длиннее.
Фактор утилизации
U (Utilization factor)Множитель в формуле Кингмана, показывающий нелинейную зависимость очереди от загрузки. При ρ → 1 фактор U стремится к бесконечности — очередь растёт взрывно.
При ρ = 0.5 фактор U = 1. При ρ = 0.8 — уже 4. При ρ = 0.95 — 19. Как пробка на дороге: при 90% заполнения вы ещё едете, при 95% — стоите.
Формула Кингмана
KingmanАппроксимация времени ожидания: Wq ≈ (ρ/(1-ρ)) × ((Ca²+Cs²)/2) × (1/μ). Ключевой инструмент анализа очередей.
Как формула для предсказания очереди: чем выше загрузка и разброс — тем длиннее ждать.
Формулы Эрланга
ErlangФормулы для расчёта вероятности блокировки (Erlang B) и ожидания (Erlang C). Используются в колл-центрах.
Как калькулятор для колл-центра: сколько операторов нужно, чтобы 90% звонков отвечали за 20 секунд.
Ценность для клиента (Value)
ЦенностьРезультат работы, за который клиент готов платить. Простой тест из трёх вопросов: 1) Меняет ли этот шаг продукт? 2) Заметит ли клиент, если его убрать? 3) Готов ли клиент платить за это? Если все три «да» — это ценность. Иначе — потери (muda).
Готовка еды — ценность: клиент заказал еду, она меняется из сырья в блюдо, он за это платит. Ожидание в очереди — не ценность: ничего не меняется, клиент был бы рад это убрать.
Шесть сигм
Six SigmaМетодология управления качеством, где σ — стандартное отклонение. Уровень σ показывает, сколько сигм помещается между средним и границей допуска (USL). 6σ = 99.99966% в допуске, т.е. 3.4 дефекта на миллион. Cpk = σ-уровень / 3.
Как оценка в школе: 2σ — двойка, 3σ — тройка, 4σ — хорошо, 6σ — золотая медаль.
Эффективность цикла процесса
PCEProcess Cycle Efficiency — доля времени, которое заявка реально обрабатывается (Value-Added), от общего времени в системе (Lead Time). PCE = Value-Added Time / Lead Time. В типичных процессах PCE = 5–25%, остальное — ожидание, перемещение, переделки.
Из 42 минут доставки DeliverGo только 22 минуты — реальная работа (готовка + доставка), а 20 минут заказ просто ждёт. PCE = 52% — почти половина времени тратится впустую.
Drum-Buffer-Rope
DBRМетод управления процессом из Теории ограничений (TOC). Drum (Барабан) — узкое место, задающее ритм всей системы. Buffer (Буфер) — запас работы перед узким местом, защищающий его от простоя. Rope (Верёвка) — сигнал к началу процесса: не запускать новую работу быстрее, чем Drum может обработать.
Представьте колонну солдат на марше. Самый медленный солдат (Drum) задаёт скорость всей колонны. Верёвка (Rope) не даёт передним уйти слишком далеко. Буфер (Buffer) — небольшой зазор перед медленным, чтобы он не останавливался из-за случайных задержек впереди.
Объединить ресурсы
Оптимизация батчей
Снизить вариабельность
Теория ограничений
Сгладить пики
Сглаживание по часам
Снизить поток
Увеличить поток
Расширить часы
Сократить простой
Добавить ресурсы
Оптимальный штат (√)
Перебалансировать нагрузку
Планирование мощностей
Сократить ресурсы
Анализ ожидания
Оптимальная загрузка
Точка бифуркации
Динамическое ценообразование
Комбо экономика
Оптимальный размер партии
Повысить цену
Снизить стоимость привлечения
Стоимость задержки
Улучшить конверсию
Буферизация
Оптим. скорость μ*
CONWIP-система
Вытягивающая система
Ограничение WIP
Закон Литтла
Критический путь
Формула Эрланга
Изменить развилку
Обход узкого места
Усилить ранний отсев
What-If анализ
Прогноз спроса
Резерв мощности
Защита от ошибок
Оптимальные точки контроля
С первого раза правильно
Приоритизация очереди
Разделить потоки
Снизить переделки
Управление буферами (TOC)
Автоматизировать задачу
Объединить задачи
Параллелизовать задачи
Перенести фильтр в начало
Удалить задачу
Ускорить задачу
Сегментация процесса
Быстрая переналадка
Группировка переналадок
Коэффициент касания
Барабан
DrumВ методе DBR — ресурс-ограничение (bottleneck), который задаёт ритм всей системы. Пропускная способность процесса = пропускная способность Drum. Все остальные этапы подстраиваются под его темп.
Барабанщик на галере задаёт ритм гребцам. Быстрее, чем он отбивает, корабль не поплывёт — неважно, сколько гребцов добавить.
Батч/Партия
BatchГруппа заявок, обрабатываемых вместе. Большие батчи экономят setup time, но увеличивают время ожидания.
Как стирка: экономнее копить бельё и стирать раз в неделю, но отдельные вещи ждут дольше.
Бережливое производство
LeanМетодология Toyota: устранение потерь (muda), снижение вариабельности, непрерывное улучшение (kaizen).
Как уборка в квартире: выбросить лишнее, разложить по местам, поддерживать порядок.
Буфер
BufferЗапас работы перед ресурсом для защиты от вариабельности. По TOC — буфер перед ограничением критичен.
Как запас деталей на складе перед станком: если поставщик задержится — станок не встанет.
Буфер
BufferВ методе DBR — временной запас работы перед узким местом (Drum). Защищает Drum от простоя из-за случайных задержек на предыдущих этапах. Drum не должен простаивать ни секунды — это самый дорогой ресурс в системе.
Небольшая корзинка с деталями перед самым загруженным станком. Если предыдущий станок задержится, загруженный станок всё равно продолжит работать из корзинки.
Быстрая переналадка
SMEDSingle-Minute Exchange of Die — методология сокращения времени переналадки до однозначного числа минут (<10 мин). Разделяет операции на внутренние (при остановке) и внешние (на ходу).
Пит-стоп в Формуле-1: всё готово заранее, замена колёс за секунды вместо минут.
Вариабельность обслуживания
CsКоэффициент вариации времени обслуживания. Cs = σs / x̄s. Показывает стабильность времени обработки.
Как разброс времени приёма у врача: у терапевта всегда ~15 мин (Cs≈0), у хирурга от 30 мин до 3 часов (Cs≈1).
Вариабельность потока
CaКоэффициент вариации входящего потока. Ca = σa / x̄a. Показывает, насколько неравномерно приходят заявки.
Как разброс времени прихода автобусов: если автобус ходит точно по расписанию — Ca≈0, если когда попало — Ca≈1.
Верёвка
RopeВ методе DBR — сигнал от узкого места (Drum) к началу процесса: не запускать новую работу быстрее, чем Drum может обработать. Ограничивает WIP (незавершённое производство) и предотвращает перегрузку системы.
Верёвка между передним и задним туристом в горах. Передний не может убежать вперёд — иначе группа растянется и потеряется.
Вероятностное распределение
РаспределениеМатематическая модель, описывающая, какие значения величина принимает и с какой вероятностью. В DES-симуляции распределения задают времена обработки, интервалы между событиями и другие случайные параметры.
Это как «портрет» процесса: курьер доставляет за 8–12 минут, но иногда за 5, иногда за 20. Распределение описывает эту картину целиком — не одним числом, а полным «портретом» всех возможных вариантов.
Верхняя граница спецификации
USLUpper Specification Limit — максимально допустимое значение, установленное SLA или стандартом. Например, если SLA обещает доставку за 45 минут — USL = 45 мин. Всё что выше — нарушение.
Как дедлайн: можно сдать раньше, но позже — уже провал.
Взвешенная кратчайшая работа
WSJFWeighted Shortest Job First — метод приоритизации: WSJF = Cost of Delay / Duration. Задачи с высоким WSJF выполняются первыми. Минимизирует суммарные потери от задержек.
Если два пожара, тушите сначала тот, где больше ущерб в минуту и быстрее потушить.
Время выполнения
Lead TimeВремя от поступления заявки до её завершения. Включает все ожидания и обработку. Lead Time = W.
Как срок доставки пиццы: от заказа до звонка в дверь, включая очередь в пекарне и дорогу.
Время касания
Touch TimeВремя, когда над заявкой реально работают (добавляют ценность). Touch Time Ratio = Touch Time / Lead Time. Типичное значение 1-5%, цель >10%.
Из 5 дней доставки посылки, её реально несут может 2 часа. Остальное — ожидание.
Время ожидания
WqСреднее время, которое заявка проводит в очереди до начала обработки.
Как долго вы стоите в очереди в банке, пока вас не позовут к окошку. Это время ожидания до начала обслуживания. Чем длиннее очередь и медленнее кассир, тем больше Wq.
Время переналадки
Setup TimeВремя подготовки ресурса к обработке нового типа заявки. Влияет на оптимальный размер батча.
Как время настройки станка под новую деталь: долгая настройка → лучше делать большими партиями.
Время полного цикла (Turn Around Time)
TATОбщее время от поступления заявки до выдачи готового результата. Включает обработку, ожидание в очереди и календарные паузы (нерабочие часы, выходные).
Сдали анализ крови в субботу утром, результат получили в понедельник вечером — TAT = 58 часов, хотя сама лабораторная работа заняла 2 часа.
Время пребывания
WСреднее время нахождения заявки в системе — сумма времени ожидания и времени обслуживания. W = Wq + 1/μ
Как общее время похода в поликлинику: сидение в очереди + сам приём у врача.
Время такта
Takt TimeТемп, с которым нужно выпускать продукцию, чтобы удовлетворить спрос. Takt Time = Доступное время / Спрос. Задаёт ритм производства.
Если за 8 часов нужно сделать 48 деталей, такт = 10 минут на деталь. Это пульс производства.
Время цикла
Cycle TimeВ контексте теории очередей (Flow Time, W) — полное время пребывания заявки в системе: ожидание в очереди + обработка. В производстве cycle time часто означает чистое время обработки без очереди, а в Lean — интервал между выпуском последовательных единиц (1/Throughput). В этом квизе используется определение из теории очередей.
Как время от заказа пиццы до её получения: включает ожидание в очереди, готовку и доставку — всё время от входа в систему до выхода.
Вытягивающая система
Pull SystemСистема, где работа начинается по сигналу от downstream (следующего этапа), а не по плану сверху. Противоположность push-системы. Основа Kanban и JIT.
Супермаркет: полки пополняются когда товар забрали, а не по расписанию.
Выход годных с первого раза
FPYFirst Pass Yield — доля изделий (или заказов), которые прошли этап правильно с первого раза, без переделок и возвратов. FPY = Годные / Всего. Например, если из 100 заказов 5 пришлось переделать — FPY = 95%.
Как процент студентов, сдавших экзамен с первой попытки — без пересдач.
Дискретно-событийная симуляция
DESDiscrete Event Simulation — метод моделирования, где система меняется только в дискретные моменты времени (события).
Как виртуальный стенд для тестирования процесса: можно 'прожить' год работы за минуты.
Доля безупречных заказов
Perfect Order RateКомплексная метрика, объединяющая качество и своевременность: Perfect Order Rate = RTY × SLA compliance. Показывает долю заказов, выполненных без дефектов И доставленных вовремя. Стандартный KPI в supply chain и логистике.
Вы заказали пиццу. Если она приехала правильная, но через 2 часа — это не безупречный заказ. Если быстро, но перепутали начинку — тоже. Безупречный = правильный + вовремя.
Доступность
AvailabilityДоля времени, когда оборудование или ресурс действительно работает, а не простаивает из-за поломок, переналадок или ожидания. Availability = Рабочее время / Плановое время. Например, если из 8-часовой смены кухня простаивала 1.2 часа — Availability = 85%.
Как посещаемость сотрудника: сколько дней из рабочих он реально на месте.
Закон Литтла
Little's LawФундаментальный закон теории очередей: L = λ × W. Среднее число заявок в системе = интенсивность × среднее время пребывания.
Как число людей в магазине = сколько входит в час × сколько часов каждый проводит внутри.
Защита от ошибок
Poka-YokeЯпонская концепция встраивания механизмов предотвращения ошибок в процесс. Три типа: предотвращающие (делают ошибку невозможной), обнаруживающие (сигнализируют об ошибке), смягчающие (минимизируют последствия).
USB-порт, который нельзя вставить неправильно — это Poka-Yoke. Невозможно ошибиться физически.
Заявка
RequestЕдиница работы, проходящая через систему: заказ, клиент, документ, деталь. В DES-симуляции заявка — это сущность (entity), которая создаётся источником, проходит через очереди и ресурсы, и покидает систему после обработки. Среднее число заявок в системе — L, скорость поступления — λ.
Покупатель в магазине — это заявка. Он входит, встаёт в очередь, обслуживается на кассе и уходит. Всё, что мы считаем (время ожидания, загрузку касс, длину очереди) — это характеристики потока заявок.
Индекс способности процесса
CpkИндекс способности процесса. Cpk = min(Cpu, Cpl), где Cpu = (USL − x̄) / (3σ) — верхний, Cpl = (x̄ − LSL) / (3σ) — нижний. При наличии только USL (как SLA на время) Cpk = Cpu. Если Cpk ≥ 1.33 — процесс стабильно выдерживает спецификацию. Cpk ≥ 1.0 — на грани. Cpk < 1.0 — процесс НЕСПОСОБЕН.
Как зазор между машиной и стенами гаража: Cpk > 1 — есть запас, Cpk < 1 — царапаете бока.
Интенсивность
IntensityСкорость поступления заявок в систему, выраженная как среднее количество заявок за единицу времени (λ). Также употребляется как «интенсивность потока» или «интенсивность нагрузки». Определяет входную нагрузку на систему: чем выше интенсивность при тех же ресурсах — тем длиннее очереди.
Интенсивность — это «напор» потока. Как сильный поток воды из крана: чем сильнее напор (больше λ), тем быстрее переполняется раковина (растёт очередь).
Интенсивность потока
λСреднее количество заявок, поступающих в систему за единицу времени.
Представьте кассу в супермаркете. λ — это сколько покупателей в среднем встаёт в очередь за час. Если λ = 20, значит каждые 3 минуты приходит новый покупатель.
Канбан
KanbanМетод управления потоком работ с визуализацией и WIP-лимитами. Основные принципы: визуализируй работу, ограничь WIP, управляй потоком, делай правила явными.
Доска с колонками «Сделать», «В работе», «Готово» и ограничением: в колонке «В работе» максимум 3 задачи.
Карта потока ценности
VSMValue Stream Mapping — визуализация всех этапов процесса с временами и запасами. Показывает потери.
Как карта путешествия заявки: где она ждёт, где обрабатывается, где застревает.
Качество
QualityДоля продукции (или услуг), выполненных правильно с первого раза, без переделок и брака. Quality = Годные изделия / Общий выпуск. Если из 78 заказов 9 переделали — Quality ≈ 88%.
Как процент сданных с первого раза экзаменов — без пересдач.
Количество ресурсов
nЧисло параллельных серверов/ресурсов, обрабатывающих заявки. Влияет на пропускную способность и утилизацию.
Как число касс в магазине: больше касс — короче очередь, но выше затраты.
Конверсия
ConversionДоля заявок, перешедших на следующий этап воронки. Conversion = Успешные / Всего × 100%.
Как процент посетителей магазина, которые что-то купили.
Коэффициент вариации
CVОтношение стандартного отклонения (σ) к среднему (x̄): CV = σ / x̄. Показывает, насколько "разбросаны" значения относительно среднего. CV = 1 — экспоненциальный хаос, CV < 1 — более предсказуемый процесс.
Представьте двух сотрудников. Оба в среднем делают задачу за 10 минут. Но первый всегда делает за 9-11 мин (CV=0.1, стабильный), а второй — за 2-30 мин (CV=1.0, непредсказуемый).
Коэффициент вариации времени обслуживания
Cs²Квадрат коэффициента вариации времени обслуживания: Cs² = (σs / x̄s)². Показывает, насколько нестабильно время обработки. Cs² = 0 — все заявки обрабатываются одинаково, Cs² = 1 — экспоненциальный разброс. Используется в формуле Кингмана для расчёта времени ожидания в очереди.
Представьте повара. Cs² ≈ 0 — каждое блюдо готовится ровно 10 минут, как на конвейере. Cs² = 1 — иногда 5 минут, иногда 20, полный разброс. Чем больше Cs², тем длиннее очереди.
Коэффициент вариации входного потока
Ca²Квадрат коэффициента вариации входного потока: Ca² = (σa / x̄a)². Показывает, насколько хаотичен поток заявок. Ca² = 1 — пуассоновский поток (полный хаос), Ca² < 1 — более регулярный, Ca² > 1 — сверххаотичный.
Представьте очередь в кафе. Ca² = 0 — клиенты приходят строго каждые 5 минут. Ca² = 1 — приходят случайно, то пусто, то толпа. Ca² > 1 — приходят группами, хаос ещё сильнее.
Коэффициент утилизации
ρДоля времени, которую ресурс занят работой. В теоретических расчетах может превышать 1.
Представьте бак бензина в машине. ρ = 0.85 значит бак заполнен на 85%. При ρ близком к 1 (почти полный бак) любой сбой критичен. Оптимально держать ρ около 70-85%.
Коэффициент SLA
βМультипликатор для расчёта буфера мощности в зависимости от целевого SLA.
Чем выше β, тем больше "подушка безопасности" для системы. Как запасной парашют — чем важнее надёжность, тем больше резерв нужен.
Критический поток
λ_critМаксимальный поток, который система может обработать. λ_crit = μ × n. При λ > λ_crit система нестабильна.
Как максимальная пропускная способность дороги: если машин больше — пробка.
Критический путь
Critical PathСамая длинная цепочка последовательных зависимых задач от начала до конца процесса. Задачи на критическом пути не имеют резерва времени — любая задержка удлиняет весь процесс.
Если для борща нужно сварить бульон (2 часа) и нарезать овощи (20 мин), критический путь — бульон. Ускорение нарезки не поможет.
Метод Монте-Карло
Monte CarloМетод статистического моделирования: многократный запуск симуляции со случайными входами для оценки распределения результатов.
Как бросать кубик 1000 раз, чтобы понять вероятность выпадения каждой грани.
Модель массового обслуживания
M/M/nМодель системы массового обслуживания в нотации Кендалла: M (Markovian) — пуассоновский входящий поток, M — экспоненциальное время обслуживания, n — количество параллельных серверов (каналов обслуживания). Частный случай M/M/1 описывает систему с одним сервером.
Представьте кассы в супермаркете: покупатели приходят случайно (первая M), каждая покупка занимает разное время (вторая M), а n — это сколько касс открыто. M/M/1 — одна касса, M/M/3 — три кассы.
Модель M/M/1
M/M/1 QueueПростейшая модель системы массового обслуживания (СМО) в нотации Кендалла. Первая M — пуассоновский (марковский) входящий поток, вторая M — экспоненциальное время обслуживания, 1 — один сервер (ресурс). Средняя длина очереди: <var>L</var><sub>q</sub> = <span class="frac"><span class="num"><var>ρ</var>²</span><span class="den">1 − <var>ρ</var></span></span>, где <var>ρ</var> = <var>λ</var> / <var>μ</var>. Обобщение на n серверов — модель M/M/n (Эрланг-C).
Представьте одинокий банкомат в торговом центре. Люди подходят случайно (в среднем λ человек в час), каждый тратит случайное время на операцию (в среднем 1/μ минут). Пока загрузка ρ = λ/μ мала (скажем, 0.5), очередь почти не ощущается. Но стоит ρ приблизиться к 1 — и очередь растёт взрывообразно. Это и есть главный урок M/M/1: система ведёт себя нелинейно вблизи полной загрузки.
Модель M/M/c
M/M/cКлассическая модель очереди: M — пуассоновский поток, M — экспоненциальное обслуживание, c — число серверов.
Как базовая модель кассы в магазине: покупатели приходят случайно, время обслуживания разное, касс несколько.
Мощность
CapacityМаксимальное количество заявок, которое система (или ресурс) способна обработать за единицу времени при полной загрузке. Capacity = μ × n, где μ — скорость одного сервера (1/S), n — число серверов. Например, 10 поваров с S = 8 мин дают мощность 10/8 = 1.25 зак/мин. Фактическая (эффективная) мощность ниже номинальной из-за переделок, простоев и вариабельности.
Мощность — это как число полос на шоссе. Каждая полоса пропускает определённое количество машин в час. Больше полос — выше пропускная способность. Но если на одной полосе авария (переделка), реальная пропускная способность падает ниже теоретической.
Незавершённая работа
WIPWork In Progress — количество заявок, находящихся в обработке. По закону Литтла: WIP = λ × W.
Как сколько блюд сейчас готовится на кухне: слишком много — хаос и задержки.
Неравномерность
MuraНеравномерность нагрузки или потока. Пики и провалы спроса создают очереди в пики и простой в провалы. Mura часто является причиной muda: неравномерный поток порождает ожидание.
В DeliverGo в обед (12:00–14:00) поток 120 заказов/час, а в 15:00 — 40. Это mura: повара завалены в пик и скучают между пиками.
Нотация Кендалла
Kendall notationСтандартная запись для описания моделей очередей в формате A/S/n, где A — распределение времени между прибытиями, S — распределение времени обслуживания, n — число серверов. M (Markov) = экспоненциальное, D (Deterministic) = постоянное, G (General) = произвольное. Примеры: M/M/1, M/M/c (Эрланг-C), G/G/1 (Кингман VUT), G/G/c (Sakasegawa).
Как GPS-координаты для очередей: три символа однозначно описывают тип системы массового обслуживания
Общая эффективность оборудования
OEEOverall Equipment Effectiveness = Доступность × Производительность × Качество. Комплексная метрика эффективности использования оборудования. Мировой класс: OEE > 85%.
Если станок работает 80% времени, на 90% скорости и 95% без брака, OEE = 0.8×0.9×0.95 = 68%.
Объединение ресурсов
PoolingСоздание общего пула ресурсов вместо выделенных. Снижает очереди за счёт статистического эффекта.
Как одна очередь ко всем кассам вместо отдельной к каждой: свободная касса сразу берёт следующего.
Оптимальный размер заказа
EOQEconomic Order Quantity — размер партии, минимизирующий суммарные затраты на заказ и хранение. Баланс между частыми мелкими заказами и редкими крупными.
Закупка продуктов: слишком часто — тратите время на магазин, слишком редко — продукты портятся.
Оптимальный штат
n*Расчётное оптимальное количество ресурсов по формуле Square Root Staffing: n* = λ/μ + β×√(λ/μ)
Идеальное число кассиров: и очереди короткие, и кассиры не сидят без дела.
Оценка баланса нагрузки
Balance ScoreМетрика равномерности загрузки ресурсов в процессе. Balance Score = 1 − (σ(ρ) / 0.3). Значение близкое к 1 означает, что все ресурсы загружены одинаково. Близкое к 0 — одни ресурсы перегружены, другие простаивают.
Представьте три кассы: одна завалена на 92%, вторая на 45%, третья на 78%. Нагрузка распределена неравномерно — Balance Score низкий. Если перераспределить людей так, чтобы все были на ~70%, Balance Score вырастет.
Оценка влияния
Impact ScoreКомплексная метрика, показывающая, насколько сильно оптимизация влияет на ключевые показатели процесса: время цикла, стоимость, пропускную способность и утилизацию. Помогает приоритизировать: сначала делаем то, что даёт максимальный эффект.
Как рейтинг фильма на Кинопоиске: одно число, которое учитывает много факторов. Impact Score = 9 значит «эта оптимизация кардинально меняет процесс», Impact Score = 2 — «мелкое улучшение».
Очередь
QueueМесто ожидания заявок перед ресурсом, когда все ресурсы заняты. Длина очереди (Lq) и время ожидания (Wq) зависят от утилизации, вариабельности и числа ресурсов. Очереди возникают математически неизбежно при любой случайности в потоке — даже если средняя загрузка ниже 100%.
Очередь в кассу супермаркета. Даже если кассир в среднем справляется, иногда покупатели приходят пачкой — и очередь растёт. Чем ближе загрузка к 100%, тем длиннее очередь.
Первый пришёл — первый ушёл
FIFOFirst In First Out — базовая дисциплина очереди. Заявки обрабатываются в порядке поступления.
Как очередь в кассу: кто раньше встал — раньше обслужен. Честно, но не всегда эффективно.
Перегрузка
MuriЧрезмерная нагрузка на людей или оборудование. Приводит к ошибкам, поломкам, выгоранию. В DES-модели проявляется как ρ > 85–90%: ресурс работает на пределе, очереди растут экспоненциально.
Кухня DeliverGo с ρ=0.92 — это muri: повара работают на 92% мощности, устают, делают ошибки, еда остывает в очереди. Снизить ρ до 0.75 — убрать muri.
Переделки
ReworkПовторная обработка из-за ошибок. Увеличивает эффективную нагрузку: λ_eff = λ / (1 - p_rework).
Как возврат товара в магазин: один возврат = двойная работа для склада.
Плотность вероятности
Функция, показывающая, насколько вероятно получить значение вблизи конкретной точки. Чем выше кривая на графике — тем чаще встречаются такие значения.
Представьте гистограмму времён доставки за месяц. Плотность — это плавная кривая, которая обводит эту гистограмму: где столбики высокие, там доставки чаще всего занимают именно столько минут.
Пожизненная ценность
LTVLifetime Value — суммарная прибыль от клиента за всё время работы с ним. LTV/CAC > 3 — здоровая экономика.
Как сколько денег принесёт абонент мобильного оператора за годы пользования.
Полезная работа
Value-AddedДеятельность, которая непосредственно создаёт ценность для клиента — то, за что он готов платить. Простой тест: если убрать этот шаг, заметит ли клиент? Если да — это Value-Added. Если нет — потери (muda). Используется для расчёта PCE.
В DeliverGo клиент платит за еду и доставку — готовка (12 мин) и доставка (10 мин) создают ценность, клиент заметит, если их убрать. А ожидание в очереди на кухню (15 мин) — нет: если убрать очередь, клиент только обрадуется. Значит ожидание — не Value-Added, а muda.
Постоянный WIP
CONWIPConstant Work-In-Process — система управления, где общее число заявок в системе фиксировано. Новая заявка входит только когда другая выходит. Комбинирует преимущества push и pull систем.
Лифт с ограничением вместимости: новый пассажир заходит только когда кто-то выходит.
Потери
MudaЛюбая деятельность, которая потребляет ресурсы, но не создаёт ценности для клиента. 8 типов: перепроизводство, ожидание, транспортировка, лишняя обработка, запасы, лишние движения, дефекты, неиспользованный потенциал людей. Одна из трёх категорий потерь в Lean (muda, mura, muri).
В DeliverGo muda — это 20 минут из 42, когда заказ просто ждёт: 15 мин в очереди на кухню, 5 мин ожидание курьера. Клиент не платит за ожидание — это чистые потери.
Правило корня
Square Root StaffingМетод расчёта оптимального штата: n* = λ/μ + β×√(λ/μ). Резерв мощности пропорционален корню из нагрузки.
Как правило для колл-центра: при удвоении звонков не нужно удваивать операторов — достаточно добавить √2 ≈ 1.4 раза больше.
Правило cμ
cμ ruleОптимальная приоритизация: приоритет = c (cost) × μ (speed). Сначала делай быстрые дорогие задачи.
Как выбор задач: если можно быстро заработать много — делай это сначала!
Приоритетная очередь
Priority QueueОчередь с приоритетами: важные заявки обрабатываются раньше. Оптимальная стратегия — правило cμ.
Как скорая помощь: тяжёлых пациентов принимают первыми, даже если они пришли позже.
Производительность
PerformanceОтношение фактической скорости работы к номинальной. Учитывает замедления, микро-остановки и работу не на полной мощности. Performance = Факт. выпуск / Номинальный. Если кухня может 100 заказов/смену, но выдаёт 78 — Performance = 78%.
Как KPI сотрудника: на месте, но работает ли на полную мощность?
Пропускная способность
ThroughputКоличество заявок, фактически выпускаемых системой за единицу времени. Не путать с мощностью (capacity) — максимально возможным выпуском. В стабильной системе throughput = λ (rate входящего потока), но throughput не может превышать capacity.
Как сколько клиентов в час может обслужить кафе: можно увеличить, добавив столики или ускорив обслуживание.
Ресурс
ResourceИсполнитель, обрабатывающий заявки: сотрудник, станок, сервер, транспортное средство. Ресурс характеризуется скоростью обслуживания (μ) и количеством параллельных единиц (n). Утилизация ресурса ρ = λ / (μ × n) показывает, какую долю времени он занят.
Повар на кухне — это ресурс. Он может готовить одно блюдо за раз (n=1). Если поваров пять — это пул ресурсов (n=5). Чем выше загрузка ресурса, тем длиннее очередь перед ним.
С первого раза правильно
FTRFirst Time Right — процент заявок, обработанных правильно с первого раза без переделок. FTR% = (Всего - Переделки) / Всего × 100%. Эффективная мощность системы = μ × FTR%.
Как сдать экзамен с первой попытки: каждая пересдача занимает время и отнимает ресурсы у других.
Сквозной выход годных
RTYRolled Throughput Yield — вероятность того, что изделие пройдёт ВСЕ этапы процесса без единого дефекта. RTY = FPY₁ × FPY₂ × … × FPYₙ. Например, 3 этапа по 95% → RTY = 0.95³ ≈ 86%. Чем больше этапов, тем сильнее падает RTY.
Как вероятность пройти все КПП без задержки: каждый пропускает 95%, но после 5 КПП пройдут только 77%.
Скорость обслуживания
μСреднее количество заявок, которые один ресурс может обработать за единицу времени.
Это как скорость работы кассира. Если μ = 30, кассир успевает обслужить 30 покупателей в час (по 2 минуты на каждого). Чем выше μ, тем быстрее рассасывается очередь.
Соглашение об уровне сервиса
SLAService Level Agreement — договорённость о целевых показателях качества услуги: время доставки, процент успешных операций, время отклика. Например, «95% заказов доставляются за 45 минут» — это SLA.
Как обещание ресторана: «Пицца за 30 минут или бесплатно».
Среднее время обслуживания
T (Service time)Среднее время, которое ресурс тратит на обработку одной заявки. Третий множитель в формуле VUT. Обратная величина к скорости обслуживания: T = 1/μ.
В DeliverGo повар готовит заказ в среднем 8 минут — это T. Чем длиннее T, тем дольше ждут следующие в очереди.
Среднее значение
x̄ (Mean)Среднее арифметическое набора значений — сумма всех значений, делённая на их количество. В теории очередей обозначает средний интервал между заявками или среднее время обслуживания.
Если за час пришло 60 заказов, средний интервал x̄ = 60 мин / 60 = 1 мин между заказами. Но реальные интервалы могут быть от 5 секунд до 5 минут — среднее не показывает разброс.
Среднее число в системе
LСреднее количество заявок, находящихся в системе (в очереди + на обслуживании).
Сколько человек сейчас в банке: и те, кто ждёт в очереди, и те, кого уже обслуживают. Это "запас" работы в системе.
Стандартное отклонение
σМера разброса значений от среднего. σ = √(Σ(x−x̄)²/n). Чем больше σ, тем выше вариабельность процесса.
Как разброс оценок в классе: если все получают 4-5, σ маленькое; если кто-то 2, кто-то 5 — σ большое.
Стоимость задержки
CoDCost of Delay — экономические потери от задержки выполнения задачи, выраженные в ₽/день или ₽/неделю. Используется для приоритизации и обоснования инвестиций в скорость.
Каждый день простоя такси — это недополученная выручка. CoD = сколько денег теряете за день ожидания.
Стоимость привлечения
CACCustomer Acquisition Cost — затраты на привлечение одного клиента. CAC = Затраты на маркетинг / Новые клиенты.
Как стоимость рекламы в пересчёте на одного пришедшего покупателя.
Страховой запас
Safety StockДополнительный запас для защиты от вариабельности спроса и поставок. Рассчитывается на основе целевого уровня сервиса и стандартного отклонения.
Держите дома запас лекарств на случай болезни — это страховой запас.
Теория ограничений
TOCTheory of Constraints — методология Голдратта. Фокус на узком месте: найти → эксплуатировать → подчинить → расширить → повторить.
Как в туристическом походе: скорость группы = скорость самого медленного. Ускорять нужно его, а не быстрых.
Теория очередей
Queueing TheoryМатематическая дисциплина для анализа систем массового обслуживания. Основа для DES-симуляции.
Как наука об очередях: почему они возникают, как их предсказать и уменьшить.
Узкое место
BottleneckРесурс или этап процесса с максимальной загрузкой, ограничивающий пропускную способность всей системы.
Как горлышко бутылки: сколько воды ни наливай, вытечет только столько, сколько пропустит самое узкое место.
Утилизация
UtilizationДоля времени, когда ресурс занят. Utilization = ρ = λ / (μ × n). Оптимум зависит от CV.
Как занятость такси: 70% времени с пассажирами, 30% — ждёт заказ.
Фактор вариативности
V (Variability factor)Множитель в формуле Кингмана (VUT), отражающий совокупный разброс потока и обслуживания. Чем выше V, тем длиннее очереди.
Представьте две кухни с одинаковой загрузкой. На первой все заказы одинаковые (V низкий) — очереди минимальны. На второй салаты и пиццы вперемешку (V высокий) — очереди в разы длиннее.
Фактор утилизации
U (Utilization factor)Множитель в формуле Кингмана, показывающий нелинейную зависимость очереди от загрузки. При ρ → 1 фактор U стремится к бесконечности — очередь растёт взрывно.
При ρ = 0.5 фактор U = 1. При ρ = 0.8 — уже 4. При ρ = 0.95 — 19. Как пробка на дороге: при 90% заполнения вы ещё едете, при 95% — стоите.
Формула Кингмана
KingmanАппроксимация времени ожидания: Wq ≈ (ρ/(1-ρ)) × ((Ca²+Cs²)/2) × (1/μ). Ключевой инструмент анализа очередей.
Как формула для предсказания очереди: чем выше загрузка и разброс — тем длиннее ждать.
Формулы Эрланга
ErlangФормулы для расчёта вероятности блокировки (Erlang B) и ожидания (Erlang C). Используются в колл-центрах.
Как калькулятор для колл-центра: сколько операторов нужно, чтобы 90% звонков отвечали за 20 секунд.
Ценность для клиента (Value)
ЦенностьРезультат работы, за который клиент готов платить. Простой тест из трёх вопросов: 1) Меняет ли этот шаг продукт? 2) Заметит ли клиент, если его убрать? 3) Готов ли клиент платить за это? Если все три «да» — это ценность. Иначе — потери (muda).
Готовка еды — ценность: клиент заказал еду, она меняется из сырья в блюдо, он за это платит. Ожидание в очереди — не ценность: ничего не меняется, клиент был бы рад это убрать.
Шесть сигм
Six SigmaМетодология управления качеством, где σ — стандартное отклонение. Уровень σ показывает, сколько сигм помещается между средним и границей допуска (USL). 6σ = 99.99966% в допуске, т.е. 3.4 дефекта на миллион. Cpk = σ-уровень / 3.
Как оценка в школе: 2σ — двойка, 3σ — тройка, 4σ — хорошо, 6σ — золотая медаль.
Эффективность цикла процесса
PCEProcess Cycle Efficiency — доля времени, которое заявка реально обрабатывается (Value-Added), от общего времени в системе (Lead Time). PCE = Value-Added Time / Lead Time. В типичных процессах PCE = 5–25%, остальное — ожидание, перемещение, переделки.
Из 42 минут доставки DeliverGo только 22 минуты — реальная работа (готовка + доставка), а 20 минут заказ просто ждёт. PCE = 52% — почти половина времени тратится впустую.
Drum-Buffer-Rope
DBRМетод управления процессом из Теории ограничений (TOC). Drum (Барабан) — узкое место, задающее ритм всей системы. Buffer (Буфер) — запас работы перед узким местом, защищающий его от простоя. Rope (Верёвка) — сигнал к началу процесса: не запускать новую работу быстрее, чем Drum может обработать.
Представьте колонну солдат на марше. Самый медленный солдат (Drum) задаёт скорость всей колонны. Верёвка (Rope) не даёт передним уйти слишком далеко. Буфер (Buffer) — небольшой зазор перед медленным, чтобы он не останавливался из-за случайных задержек впереди.
