Internet-телефония. Статья обновлена в 2023 году.

Internet-телефония

Internet-телефония

На протяжении нескольких последних лет в мире наблюдается быстрый рост числа пользователей сети Internet. Ее популярность объясняется богатым набором услуг и возможностей: электронная почта (E-mail), «всемирная паутина» (WWW), сетевые конференции (NNTP), голосовая почта (voice mail), Internet-телефония (Internet Telephony — IT) и другие.

Настоящая статья посвящена перспективам и проблемам развития IT на основе телефонных шлюзов (phone gateway network). С их помощью обычный телефонный аппарат становится средством доступа к глобальной телефонной сети, построенной на базе Internet. Такая сеть более интеллектуальна по сравнению с обычной телефонной сетью, так как все функции телефонных коммутаторов выполняются компьютерами.

Еще недавно можно было сказать, что по каналам связи передается цифровая и аналоговая информация. С развитием Internet грань между этими двумя видами информации начинает стираться и, возможно, через некоторое время исчезнет совсем.

Для передачи информации разного рода, как правило, требуются различные сетевые технологии. Так, в сети Internet применяются следующие протоколы передачи данных: TCP/IP, X.25, Frame Relay, PPP, ISDN, ATM и др. В результате возникает немало технических, организационных и экономических сложностей в проектировании сетей и управлении ими, например, при интеграции сетей, построенных на разных принципах (сети с коммутацией каналов и пакетов; сети, ориентированные на соединение, и широковещательные сети). Имеют место проблемы, связанные с приемом, обработкой и распределением телефонных и факсимильных сообщений, мультиплексированием голоса и данных, качеством и задержками при передаче голоса, пропускной способностью каналов и тарификацией новых услуг.

Возникновение Internet-телефонии

До 1995 г. IT еще не была столь известна. Существовали отдельные свободно распространяемые программы (public domain), созданные программистами-исследователями без перспективы их широкого применения, так как считалось невозможным получить качественное голосовое соединение через Internet. Компания VocalTec, выпустившая в феврале 1995 г. программу Internet Phone, доказала обратное. Установленная на персональный компьютер (486/33МГц или выше), оснащенный средствами мультимедиа (звуковая карта, микрофон, колонки) и подключенный к Internet (рис. 1), программа Internet Phone позволяет разговаривать с другим пользователем PC в любой точке мира.


Рис.1. Конфигурация персонального компьютера для VoIP

В конце 1995 г. общее количество активных пользователей IT оценивалось уже в 500 тыс. (Активные пользователи постоянно обращаются к IT, в отличие от тех, кто, имея возможность работать с IT, ее не использует.) Львиную долю рынка IT—94%—занимала продукция VocalTec.

Первоначально пользователями IT были лица, ведущие телефонные переговоры по Internet на больших расстояниях друг от друга или осуществляющие небольшие эксперименты в деловых lntranet-ириложениях. Потенциальное будущее технологии — интерактивная электронная торговля, коммуникации внутри компаний, международная телефонная связь через Internet.

В настоящее время IT активно развивается. По прогнозам компании IDC, к концу 1999 г. число пользователей IT всех категорий должно возрасти до 16 млн. Десятки компаний выпустили программные продукты, которые обеспечивают голосовые соединения через Internet в режиме реального времени (наиболее известные из них приведены в табл. 1).


Табл.1. Программные продукты для VoIP

В предлагаемых продуктах качество передачи голоса варьируется от сравнимого со стандартным телефонным соединением (Digiphone) до едва различимого голоса (Netphone). В настоящее время большинство программ обеспечивает приемлемое качество голосовой передачи даже при модемном соединении с Internet на скорости 28,8 кбит/с. Качество связи значительно снижается при скорости 14,4 кбит/с.

Недостатком всех перечисленных продуктов можно считать обязательное наличие у конечных пользователей компьютеров с голосовыми платами, подключением к Internet и однотипным программным обеспечением. Следующим шагом в развитии IT являются технологии компьютер—сеть— телефон и телефон—сеть—телефон с возможностью соединения через Internet по обычному телефонному аппарату.

Компания IDT анонсировала систему Net2 Phone — первую коммерческую услугу с предоставлением пользователям Internet в США возможности делать телефонные звонки внутри страны. Пока в большинстве городов США эта система обеспечивает только соединение компьютер—телефон, когда звонящий выходит на связь через компьютер, подключенный к Internet, а вызываемый абонент отвечает по обычному телефону (рис. 2).


Рис.2. Технология Net2Phone

IDT объявила о своем намерении в 1998 г. обеспечить пользователям Internet возможность звонить из любой точки мира в США.

Хотя данная услуга еще не предоставляется, предполагается, что плата не будет превышать 0,1 дол/мин. Планируется также оказывать услуги типа телефон— сеть—телефон, когда не требуется наличия компьютера у осуществляющего вызов абонента.

Телефонный шлюз Internet

В марте 1996 г. компании VocalTec и Dialogic объединили усилия по разработке телефонного шлюза Internet (Internet Telephony Gateway — ITG). В результате появился новый программный продукт — VocalTec Telephony Gateway (VTG), который поддерживает до 30 одновременных голосовых соединений. В России его презентация состоялась на выставке «Комтек-97». В настоящее время уже установлено несколько корпоративных линий связи через VTG между крупными городами России: Москвой, Новосибирском, Самарой, Санкт-Петербургом и др.

Возможности связи через сеть телефонных шлюзов практически не ограничены. Подобные шлюзы способны объединять через Internet локальные телефонные сети общего пользования (PSTN) в разных городах, частные телефонные сети мини-АТС (РВХ), компьютерные локальные сети (Ethernet). Они делают Internetтелефонию по-настоящему удобной, поскольку абонент может позвонить на любой телефонный номер в другом городе или стране (рис. 3). Звонок по сети Internet достигает города и выходит через сервер на городские телефонные линии. Терминальным оборудованием может служить как персональный компьютер, так и обычный телефонный аппарат с тональным набором.


Рис.3. Технология VoIP-сети

Процедура установления соединения через Internet для абонента практически не отличается от обычного международного звонка. Абонент снимает трубку, набирает номер локального ITG, проходит авторизацию, набирает номер удаленного ITG и номер вызываемого абонента. После того, как абонент дозвонился до местного ITG через PSTN или РВХ, прошел авторизацию, набрал код страны и города, ITG запрашивает IP-адрес удаленного ITG по его телефонному номеру у сервера (LDAP Directory Server). Определив IP-адрес ближайшего к вызываемому абоненту ITG, местный ITG устанавливает с ним соединение через Internet. Удаленный ITG, в свою очередь, вызывает своего абонента через PSTN или корпоративную РВХ. Когда абонент кладет трубку, ITG разрывает соединение с удаленным ITG и производит все необходимые учетные записи по времени соединения и т.д.

С использованием телефонных шлюзов возможны звонки следующих типов (рис. 4,5):

С телефона на телефон (см.рис. 5)


Рис.5. Соединение телефона с телефоном через сеть

Звонок идет через телефонную сеть общего пользования (PSTN) или непосредственно с офисной цифровой мини-АТС (РВХ) выходит на ближайший ITG. Затем, после автоматической подсказки, звонящий на телефонной клавиатуре набирает номер конечного абонента. Звонок через Internet идет на ITG, находящийся ближе всего к абоненту. Отсюда звонок через ITG или офисную миниАТС направляется к абоненту.

С факса на факс

Для того чтобы отправить факс, достаточно запрограммировать факс-аппарат на автоматический набор номера ITG и необходимого номера. Факс выходит на ближайший ITG через АТС или офисную мини-АТС. Затем, через Internet факс идет на ITG, находящийся ближе всего к факсу абонента, а оттуда направляется к месту назначения.

С телефона на компьютер

Если звонить с телефона на компьютер, то звонок по АТС или через офисную мини-АТС поступает на ближайший ITG. После автоматической подсказки голосовой системы с помощью телефонной наборной панели вводится Internetадрес абонента и звонок направляется на нужный компьютер.

С компьютера на телефон (см. рис. 4)


Рис.4. Соединение компьютера с телефоном

Звонок с компьютера по Internet поступает на ближайший к абоненту ITG и оттуда через АТС или офисную мини-АТС направляется к вызываемому абоненту.

В первых двух случаях используется два телефонных шлюза, в последних двух — один. Стоимость звонка во всех случаях определяется стоимостью подсоединения к Internet плюс возможные издержки за пользование общественной телефонной сетью.

Для соединения с пользователем Internet нужно знать IP-адрес или доменное имя его хост-компьютера. Телефонные шлюзы решают проблему адресации, так как в этом случае достаточно знать только номер абонента. За каждым телефонным шлюзом может быть закреплен определенный номерной план. Таблица соответствия телефонных номеров IP-адресам шлюзов хранится на телефонном сервере (LDAP Directory Server). Последовательность установления голосового соединения через Internet показана на рис. 6.


Рис.6. Последовательность установления VoIP соединения

Работу телефонного шлюза иллюстрирует табл. 3. Один интерфейс (FXS, FXO, Е&М, Е1/Т1) соединен с телефонной сетью, другой — с Internet (Ethernet, Frame Relay, ATM). ITG принимает телефонный сигнал, оцифровывает его (если он аналоговый), компрессирует, разбивает на IP пакеты и отправляет на маршрутизатор. ITG производит обратное преобразование пакетов, поступающих от маршрутизатора, в телефонный сигнал. Таким образом обеспечивается полнодуплексное соединение. Подавляющее большинство ITG управляется по протоколу SNMP с помощью любого SNMP-менеджера, например, HP Open View.


Табл.3. Функциональная схема телефонного шлюза

В функции ITG также входит устранение эха (рис. 7), возникающего в телефонных системах изза отражения сигнала, например, при переходе с двух- на четырехпроводную линию. Эффект эха явно проявляется при телефонных звонках на большие расстояния, когда велика задержка сигнала, при локальных звонках устранять эхо в телефонной системе не требуется. В IT телефонные системы используются только для локальных звонков, поэтому функция устранения эха при соединении ложится на ITG.


Рис.7. Устранение эха в системах IT

Проблемы возникают при передаче по Internet сигналов DTMF (Dual tone multi-frequency). Сегментация на IP-пакеты делает их неразличимыми на удаленном конце. ITG должен различить DTMF, прервать передачу и сгенерировать их на удаленном конце.

Ключевым вопросом использования IT в бизнес-приложениях является качество передаваемого голоса и задержки. Качество передачи голоса значительно улучшилось по сравнению с ранними версиями программных продуктов для IT, устранены искажения. Этого удалось достичь за счет улучшения механизмов кодирования, воссоздания утерянных пакетов.

Задержка, превышающая 250 мс, существенно ухудшает качество соединения. IP протокол проектировался без учета возможности передачи голоса в режиме реального времени. В отличие от телефонной сети, построенной по принципу коммутации каналов, в Internet используется принцип коммутации пакетов. Значительные задержки возникают тогда, когда голосовые IP-пакеты передаются по разным маршрутам и нарушается последовательность их приема. Протокол IP не позволяет предсказывать эти задержки.

Международные стандарты

Для развития IT важное значение имеют международные стандарты. В 1996 г. Международный союз электросвязи — МСЭ ( International Telecommunications Union) разработал рекомендацию Н.323 (рис. 8). В ней определяются стандарты на передачу данных, видео- и голосового трафика, когда одним или более участком сетевого соединения служат локальные сети IP, а также стандарт для телеконференций Т. 120. МСЭ рекомендует использовать RTP/RTCP (Real-Time Protocol/Real-Time Control Protocol) для управления аудио- и видеотрафиком. Н.323 определяет, каким образом критичный к задержкам аудиотрафик получает более высокий приоритет в Internet, чем другие виды трафика (Н.324 относится к выделенным линиям, Н.320 — к ISDN).


Рис.8. Спецификация H.323

Организация IETF (Internet Engineering Task Force) вместе с крупнейшими сервис-провайдерами Internet предлагает использовать протокол резервирования ресурсов (Reservation Protocol — RSVP) при передаче голоса по Internet. RSVP позволяет резервировать полосу пропускания и обеспечивает так называемое качество услуги (QoS). Однако потребуется время для того, чтобы все существующие маршрутизаторы перешли на поддержку RSVP.

В рекоменадцию Н.323 входит также утвержденный МСЭ в ноябре 1995 г. стандарт на сжатие голоса G.729. В большинстве телефонных сетей мира используется адаптивная разностная импульсно-кодовая модуляция (ADPCM) с пропускной способностью канала в 32 кбит/с (определяется стандартом G. 724). Алгоритм компрессии ADPCM основан на кодировке различия между уровнями сигнала, а также динамической подстройке в зависимости от уровня входного сигнала.

Новый алгоритм компрессии позволяет достичь при передаче голоса со скоростью 8 кбит/с того же уровня качества, что и при передаче с использованием ADPCM со скоростью 32 кбит/с. В основу нового стандарта был положен алгоритм CS-ACELP (Conjugate Structured-Algebraic Code Excited Linear Predictive). CS-ACELP формирует голосовые пакеты по 10 бит каждые 10 мс, основываясь на 80 шаблонах стандартной ИКМ-1 (64 кбит/с). Алгоритм обеспечивает высокое качество передачи голоса при минимальных задержках на процессорах DSP (Digital Signal Processors).

Одним из примеров реализации G.729 на практике служит технология ClearVoice компании Micom. ClearVoice упаковывает голосовые фрэймы G.729 так, что они вместе со служебной информацией занимают примерно 9 кбит/с арендованной выделенной линии или 10,6 кбит/с подключения Frame Relay. Экономия пропускной способности канала достигается также за счет использования метода подавления пауз: в разговоре по одному каналу паузы заполняются оцифрованным голосом или данными из других каналов. Как подтверждают исследования, голосовой трафик на 50—70% состоит из пауз, таким образом требования к средней пропускной способности канала снижаются до 4 кбит/с, поэтому метод подавления пауз весьма эффективен.

За счет своей экономичности технология ClearVoice позволяет организовать большее число голосовых каналов на соединении меньшей пропускной способности, обеспечивая высокое качество передачи голоса. Приведем лишь некоторые примеры:

— С помощью технологии MicroBand АТМ могут быть образованы два высококачественных голосовых канала на выделенной линии со скоростью 19,2 кбит/с, при этом для передачи данных остается 10—12 кбит/с.

— На канале Frame Relay CIR 64 кбит/с можно организовать 7 голосовых каналов высокого качества.

— Набор из 30 голосовых каналов на линии Е1 можно сжать до 256 кбит/с, передаваемых по выделенной линии или соединению Frame Relay.

Аппаратное обеспечение

Основным оборудованием для IT являются платы расширения к компьютеру, включающие: голосовые, факсимильные и коммутационные платы, платы распознавания голосовых команд, платы преобразования «текст—речь» и «пульс—тон». В зависимости от функциональных требований и количества телефонных линий в компьютер устанавливают необходимое количество плат расширения, соединенных с помощью шины SCbus. SCbus — это двунаправленная высокоскоростная мультиплексированная шина с емкостью до 1024 полнодуплексных каналов и возможностью коммутации любых двух каналов. Через SCbus можно соединить несколько компьютеров, имеющих платы Dialogic.

Голосовые платы — основной элемент систем IT. Они обеспечивают соединение по телефонным линиям и голосовое взаимодействие. Голосовые платы построены на специализированных процессорах DSP, которые выполняют ряд функций (оцифровка, сжатие, воспроизведение речи, распознавание сигналов тонового набора) без обращения к центральному процессору. Кроме того, с их помощью реализуются команды пользователя при последовательном нажатии на клавиши телефонного аппарата с тональным набором. Число обслуживаемых каналов от 2 до 30.

Факсимильные платы отвечают за прием и отправление факсимильных сообщений (по списку, по запросу), преобразование текстовых файлов в образы документов и их кодирование для пересылки по факсу. Конструктивно эти платы могут быть выполнены в виде автономных устройств или приставок к голосовым платам. Число каналов от 1 до 30.

Коммутационные платы предназначены для интеллектуальной коммутации голосовых каналов как местных, так и внешних линий и организации конференций с числом участников от 2 до 8.

Платы распознавания голосовых команд необходимы для восприятия голосовых команд абонента и используются в тех случаях, когда невозможно подать команду с клавиатуры телефонного аппарата (например, если аппарат не поддерживает тональный набор).

Платы преобразования «текст— речь» позволяют синтезировать речевое сообщение по текстовому файлу, применяются для создания системы голосовых меню.

Платы преобразования «пульс— тон» осуществляют преобразование сигналов пульсового набора в сигналы тонового набора, обеспечивая их распознавание голосовыми платами.

Указанный набор плат расширения для систем IT представляет собой открытую технологию на основе архитектуры SCSA (Signal Computing System Architecture), разработанную компанией Dialogic. SCSA определяет стандарт на аппаратные средства и программное обеспечение, позволяя строить гибкие системы компьютерной телефонии. О своей поддержке SCSA объявили около 300 фирмпроизводителей аппаратного обеспечения для IT, разработчики программного обеспечения, а также производители телекоммуникационных средств.

Технология интегрированного мультиплексирования Data/Voice/Fax/LAN

Одним из главных достоинств IT является возможность одновременной передачи по одним и тем же каналам связи данных, голоса, факсимильных сообщений, трафика локальных компьютерных сетей. За счет этого максимально повышается пропускная способность канала и, учитывая, что это наиболее дорогой телекоммуникационный ресурс, достигается значительная экономия средств.

Существует несколько технологий мультиплексирования, обладающих своими преимуществами и недостатками (см. табл. 4).


Табл.4. Основные характеристики различных технологий мультиплексирования

Мультиплексирование с временным разделением

Технология мультиплексирования с временным разделением (TDM — Time Division Multiplexing) основана на делении всей ширины диапазона пропускной способности канала на фиксированные временные интервалы (тайм-слоты), каждому из которых отводится определенный временной интервал для работы в сети. Обеспечивая очень низкую степень задержки, технология TDM наиболее подходит для передачи голоса и видеоизображения. Однако TDM имеет низкую эффективность в сети, так как при возникновении интервала в передаче данных по одному из каналов ни один другой канал не может использовать его пропускную способность. При передаче данных и голоса эффективность TDM составляет в среднем 10—25%.

Статистическое пакетное мультиплексирование

Статистическое пакетное мультиплексирование (SPM — Statistical Packet Multiplexing) включает в себя принципы Х.25 и технологию статистического мультиплексирования. SPM предоставляет полосу только активным каналам и динамически распределяет полосу между ними.

С помощью мультиплексора активные данные преобразуются в пакет, к которому добавляется идентификатор и контрольная сумма, необходимые для коррекции возникающих ошибок и маршрутизации. Передача пакета по сети осуществляется по принципу «хранить—отправить» (store-and-forward), который предусматривает, что на следующий узел пакет начинает передаваться только после полного приема на текущем узле.

SPM решает основные проблемы TDM, однако имеет собственные недостатки: увеличивает задержки при прохождении данных по сети, а также усложняет предсказание этой задержки. Сам принцип «хранить—отправить» повышает задержку передачи, а процесс коррекции ошибок и изменяющийся размер пакета делают непредсказуемым время его прибытия.

Быстрое пакетное мультиплексирование

Быстрое пакетное мультиплексирование (FPM — Fast Packet Multiplexing) сохраняет все достоинства как SPM (динамическое распределение диапазона), так и TDM (небольшая величина задержки трафика). FPM обеспечивает обнаружение/коррекцию ошибок по всей сети, что значительно уменьшает задержки прохождения пакета. При использовании FPM необходимо получить только несколько байт пакета перед тем, как пакет будет маршрутизирован в следующую сеть.

FPM решает свойственные SPM проблемы задержки в сети, но не обеспечивает предсказания времени прибытия информации. Пакеты FPM различаются по длине от нескольких десятков до тысяч байт. Голосовой пакет, критичный к временным задержкам, будет ожидать, пока завершится передача длинного пакета данных.

Примером реализации FPM является относительно недорогая и популярная в мире технология Frame Relay (FR). В отличие от АТМ, создаваемой как высоко интеллектуальная интегрированная сеть для передачи информации различных видов, FR предназначена для экономичного обмена данными с коммутацией пакетов.

Технология FR присваивает различные приоритеты разным видам трафика, причем голосовой трафик имеет наивысший приоритет. Поскольку система приоритетов сети FR не гарантирует времени доставки, можно говорить лишь о сокращении вероятного времени доставки пакетов всеми возможными способами. Обычно принимается, что между двумя голосовыми пакетами в очереди находится не более двух пакетов данных.

Во время передачи голосовой информации может включаться так называемый режим сегментации пакетов, когда данные разбиваются на очень короткие пакеты, при этом время передачи каждого пакета составляет от 5 до 10 мс. Таким образом удается сократить интервалы между голосовыми пакетами.

Асинхронный метод передачи

Одна из современных перспективных сетевых технологий — асинхронный метод передачи (Asynchronous Transfer Mode — АТМ). Применение АТМ позволяет решить одну из основных проблем в сетях с коммутацией пакетов — проблему переменных задержек в процессе передачи информации всех видов.

Коммутаторы АТМ соединяются между собой с помощью транков, по которым одновременно могут передаваться данные, голос, видео. Технология АТМ основана на использовании ячеек (cell) фиксированной длины (53 байта), что становится эффективным на каналах со скоростью свыше 2 Мбит/с (табл. 5). На меньших скоростях может применяться технология Micro Band АТМ.


Табл.5. Стандартные скорости передачи для каналов ATM

При использовании АТМ перед началом передачи данных устанавливается виртуальное соединение между источником и приемником, ячейки передаются только по этому пути, и их последовательность не нарушается. Кроме того, в АТМ применяется понятие «качество услуг» (quality of services): отвечающее за соединение оборудование делает запрос определенных приоритетов для трафика, передаваемого по данному виртуальному каналу. Имеется возможность задавать четыре уровня услуг: CBR (Constant Bit Rate — постоянная скорость передачи), VBR (Variable Bit Rate — переменная скорость цередачи), ABR (Available Bit Rate — доступная скорость передачи), UBR (Unspected Bit Rate — неопределенная скорость передачи). Наиболее приоритетная CBR обеспечивает гарантированную скорость и используется для передачи голоса.

MicroBand АТМ

Для низкоскоростных каналов связи разработана технология MicroBand АТМ (М-АТМ), представляющая собой комбинацию быстрого пакетного мультиплексирования и коммутации ячеек. МАТМ позволяет повысить эффективность использования полосы канала до 90—95%.


Табл.6. Сравнительные характеристики технологий MicroBand ATM и ATM

MicroBand АТМ динамически распределяет диапазон, предоставляя его только активным пользователям. Так же, как и АТМ, технология М-АТМ в 5—10 раз эффективнее, чем TDM, однако не нуждается в высокоскоростных и дорогостоящих каналах (табл. 6).

Перспективы

На развитие IT влияют многие факторы. В настоящее время пропускная способность Internet недостаточна для широкого применения IT во всем мире. Наиболее вероятно распространение IT в корпоративных Intranet и коммерческих Extranet сетях, где единый оператор может контролировать пропускную способность сети.

Другим немаловажным элементом развития ИТ является эволюция ITG от платформы персонального компьютера к специализированному коммутатору, способному обрабатывать сотни голосовых соединений одновременно. Подобные коммутаторы объединяют данные, голос, видео в едином канале связи. В данном случае IP выступает как унифицированный промежуточный уровень между приложением и нижележащим физическим уровнем (выделенная линия, Frame Relay, АТМ).

Заметной тенденцией развития IT становится применение технологии АТМ для построения магистральных сетей (backbone) крупнейшими ISP.

В ближайшие годы увеличение скоростей каналов и повышение эффективности их использования может превратить Internetтелефонию в столь же распространенную и удобную услугу, как электронная почта сегодня.

Литература в Internet:

1. dialogic, corn

2. vocaltec.corn

3. micom. corn

4. webproforum. corn/siemens2

5. rpcp.mit.edu/~itel/resource, htm I

6. bcs-usa/vip.html