В первой части цикла статей мы рассмотрели преобразование человеческого голоса в электрический сигнал. Теперь, казалось бы, самое время передать этот сигнал до местонахождения собеседника и начать разговор! Именно так первоначально и поступали. Однако чем более востребованной становилась услуга и чем на большие расстояния было необходимо передавать сигнал, тем понятнее становилось, что аналоговый сигнал для этого не годится.
Для того чтобы обеспечить передачу информации на любое расстояние без потери качества, нам потребуется произвести второе преобразование из Аналогового сигнала в Цифровой.
Эта картинка дает самое наглядное представление о том, что происходит при Аналого Цифровом Преобразовании (АЦП) а далее мы рассмотрим зачем это нужно, как происходило развитие технологии, и какие требования накладываются на такое преобразование в мобильных сетях.
Те, кто пропустил или подзабыл, о чем шла речь в первой части, могут вспомнить Как мы получили из звуковых колебаний электрический сигнал, а мы продолжим описание преобразований, перемещаясь по картинке, на которой обозначена новая область, интересующая нас в данный момент:
Сначала давайте поймем, зачем вообще нужно преобразовывать аналоговый сигнал, в какие-то последовательности нолей и единичек, которые без специальных знаний и математических преобразований и услышать невозможно.
После микрофона у нас есть аналоговый электрический сигнал, который можно с помощью динамика легко «озвучить», что, собственно, и производилось в первых опытах с телефонами: обратное преобразование «электрический сигнал – звуковая волна» выполняли в том же помещении или на минимальном расстоянии.
Только для чего нужен такой телефон? В соседнее помещение можно донести звуковую информацию без всяких преобразований – просто повысив голос. Поэтому появляется задача – услышать собеседника на максимальном расстоянии от инициатора разговора.
И вот тут в силу вступают неумолимые законы природы: чем больше расстояния, тем сильнее электрический сигнал в проводах затухает, и через какое-то количество метров/километров восстановить из него звук будет невозможно.
Те, кто застал городские проводные телефоны, работающие с декадно-шаговыми АТС (аналоговыми телефонными станциями), прекрасно помнят, какое качество голоса порой предоставлялось с помощью этих аппаратов. А кто-то может вспомнить и такие всеми забытые экзотические включения «через блокиратор» / «параллельный телефон», когда два телефона в одном доме включались на одну телефонную линию, при этом, когда один абонент занимал линию, второй был вынужден ждать окончания его разговора. Поверьте – это было нелегко!
То есть для увеличения количества одновременных вызовов между двумя точками, с использованием аналоговых линий нам требуется прокладывать все больше и больше проводов. К чему это может привести, можно оценить по городским пейзажам начала прошлого века:
Поэтому сразу после изобретения телефона, лучшие инженеры взялись за решение задачи: как передать голос на большие расстояния с максимальным сохранением качества и минимальными затратами на оборудование.
Что же нам необходимо для того, чтобы непрерывный аналоговый электрический сигнал превратился в дискретный, закодированный последовательностями нолей и единиц, и при этом передавал информацию максимально приближенную к оригиналу?
Немного теории.
Чтобы преобразовать любой аналоговый сигнал в цифровой, необходимо через определенные промежутки времени (шаг дискретизации на картинке ниже) зафиксировать амплитуду сигнала с определенной точностью (шагом квантования).
После оцифровки получится ступенчатый график, показанный на рисунке. Для максимального приближения оцифрованного сигнала к аналоговому необходимо шаг дискретизации и шаг квантования выбирать как можно меньше, при бесконечных значениях мы получим идеально оцифрованную запись.
На практике бесконечная точность оцифровки не требуется, и нужно выбрать, какая точность может считать достаточной для передачи голоса с требуемым качеством?
Здесь нам на помощь придут знания о чувствительности человеческих органов слуха: принято считать, что человек может различать звуки с частотой от 20Гц до 22.000Гц. Это граничные значения для дискретизации, которые позволят передать любой звук, воспринимаемый человеком. Если перевести Гц в более привычные секунды – получим 0,000045 секунды, то есть измерения необходимо производить каждые 4,5 сто-тысячных секунды! Более того – и этого оказывается недостаточно. О причинах и требуемых значениях частоты дискретизации расскажем чуть ниже.
Теперь определимся с шагом квантования: шаг квантования позволяет присвоить в каждый момент времени определенное значение амплитуды измеряемому сигналу.
В первом приближении можно просто проверять наличие или отсутствие сигнала, для описания такого количества вариантов нам будет достаточно всего двух значений: 0 и 1. В информатике это соответствует количеству информации: 1 бит и битность записи будет равна 1. Если оцифровать любой звук с такой битностью, на выходе мы получим прерывистую запись, состоящую из пауз и звука одного тона, вряд ли это можно назвать записью голоса.
Поэтому придется увеличить количество измеряемых вариантов амплитуды, например, до 4 (то есть до 2 бит – 2 в степени 2): 0 — 0,25мА – 0,5мА – 0,75мА.
С такими значениями уже можно будет различить некоторые изменения звука после оцифровки, а не только его наличие или отсутствие. Иллюстрация прекрасно показывающая, что дает нам увеличение битности (квантования) при оцифровке звука, приведена на этом рисунке:
Теперь, увидев в свойствах музыкального файла цифры 44 кГц/16 бит, вы можете сразу понять, что Аналого-Цифровое Преобразование производилось с дискретизацией 1/44кГц = 0,000023 секунды и с глубиной квантования 2 в 16 степени – 65.536 вариантов значений.
Первые схемотехнические решения для выполнения АЦП-ЦАП преобразований были как всегда большими и медленными:
Сейчас эти задачи выполняются в основном процессоре мобильного телефона, который одновременно справляется с огромным количеством других задач:
Если провести оцифровку без дополнительной оптимизации полученной цифровой модели, объем полученных данных будет очень велик, достаточно вспомнить, сколько места на вашем диске может занять звуковой файл в несжатом виде. Стандартный CD, для примера, это 780 мегабайт информации и всего 74 минуты звука!
После обработки такого файла с применением алгоритмов оптимизации и сжатия с потерями данных (например, mp3) объем файла можно снизить в 10 и более раз.
Для наших целей объем получаемых данных имеет принципиальное значение, поскольку их еще необходимо передать до вашего собеседника, и ресурс транспортного канала очень ограничен.
Вновь задача для инженеров – максимальная оптимизация объема передаваемых данных с сохранением требуемого качества.
В разговорной речи, которая звучит во время телефонного диалога, спектр частот существенно ниже доступного для восприятия, поэтому для передачи телефонного разговора можно ограничиться более узким спектром: например 50..7000Гц. Про это мы достаточно подробно писали в материале о голосовых кодеках в мобильных сетях.
Теперь у нас есть исходные данные для начала преобразования – электрический аналоговый сигнал, в спектре 50-7000Гц, и нам необходимо провести преобразование А-ЦП, таким образом, чтобы искажение сигнала при преобразовании (те самые ступеньки на графике выше) не повлияло на качество записи. Для этого нужно выбрать значения шага дискретизации и шага квантования, достаточные для полного описания имеющегося аналогового сигнала.
Здесь нам на помощь придет одна из основополагающих теорем в области цифровой обработки сигналов — Теорема Котельникова.
В ней наш соотечественник математически обосновал, с какой частотой необходимо проводить измерения значений функции для её точного числового представления. Для нас важнейшее следствие данной теоремы заключается в следующем – измерения нужно проводить в два раза чаще самой высокой частоты, которую нам необходимо перевести в цифровой вид.
Поэтому шаг дискретизации для оцифровки разговора, будет достаточно взять на уровне 14 кГц, а для качественной оцифровки музыки — 2 х 22кГц, здесь мы и получаем стандартные 44кГц, с которыми сейчас, как правило, создаются музыкальные файлы.
Существует большое количество самых разнообразных голосовых кодеков, которые могут применяться в проводных и беспроводных сетях, причем кодеки для проводных сетей, в общем случае, кодируют голос с лучшим качеством, а кодеки для беспроводных сетей (сетей мобильных операторов) — с немного худшим качеством.
Зато эти кодеки генерируют дополнительные данные, для восстановления получаемого сигнала в случае неуспешной доставки из-за сложных радиоусловий. Эта особенность называется помехозащищенностью, и развитие кодеков для мобильных сетей происходит в направлении улучшения качества передаваемого сигнала с одновременным увеличением его помехозащищенности.
В мобильных сетях используются целые классы голосовых кодеков, которые включают в себя набор динамически выбираемых скоростей кодирования, в зависимости от текущего положения абонента и качества радиопокрытия в этой точке:
В таблице перечислены все кодеки, используемые в современных мобильных сетях, из них кодеки с динамическим битрейтом (в которых меняется соотношение полезных данных и избыточных для восстановления данных) имеют название AMR – Adaptive Multi Rate. Кодеки FR/HR/EFR используются только в сетях GSM.
Чтобы наглядно представить насколько больше данных кодируется в высокоскоростных кодеках, взгляните на следующую картинку:
Переход от кодеков класса AMR к AMR-WB почти удваивает количество данных, а AMR-WB+ требует еще на 40-50% больше ширины транспортного канала!
Именно поэтому в мобильных сетях широкополосные кодеки в мобильных сетях еще не нашли широкого применения, но в будущем возможен переход на Super Wide Band (AMR-WB+) и даже на Full Band полосу, к примеру для онлайн трансляций концертов.
Итак – после выполнения второй стадии преобразования голоса, мы вместо звуковых колебаний получаем поток цифровых данных, готовых к передаче через транспортную сеть.
До момента обратного преобразования цифр в аналоговый сигнал эти данные сохраняются почти без изменений (иногда в процессе доставки голоса может происходить перекодировка из одного кодека в другой), и дальнейшие преобразования происходящие с нашим голосом, будут касаться физической среды через которую передается вызов.
В следующем материале мы рассмотрим, что происходит между телефоном и базовой станцией и каким чудесным образом сформированный нами поток данных без проводов доставляется до оборудования оператора.
P.S. Всем кому интересна тема цифровой связи и история её развития, крайне рекомендую книгу «И мир загадочный за занавесом цифр» авторы Б.И.Крук, Г.Н.Попов. С точки зрения современных стандартов и технологий она немного устарела, но теоретическую и историческую часть авторы описывают прекрасно, разбавляя сухую теорию живыми примерами и иллюстрациями.
Голос по проводам: как изобрели телефон
После изобретения в 1833 году прообраза современных коммуникаций, электрического телеграфа, изобретатели стали думать над следующим шагом – передачей голоса. В 1854 году идею озвучил француз Шарль Бурсёль, предложивший свое устройство в виде «очень гибкой мембраны, способной регистрировать малейшие колебания».
По задумке изобретателя, такая мембрана замыкала и размыкала бы электрическую цепь, передавая звуковые колебания. Но дальше теории Бурсёль не пошел, поэтому первым человеком, которому удалось проверить эту схему на деле, стал немецкий преподаватель физики Иоганн Филипп Рейс. В 1860 году он продемонстрировал работающий аппарат, который с помощью вязальной спицы, мембраны из пергамента, платиновой фольги и пружинки замыкал и размыкал цепь в такт колебаниям воздуха и был способен передавать звук на расстояние с помощью электричества. Звук — но, увы, не речь! Если музыкальные тона еще более-менее можно было разобрать, то для передачи человеческой речи аппарат Рейса не годился.
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
В 1870-х свет увидели несколько усовершенствований телеграфа, позволившие передавать по одной паре проводов несколько независимых сообщений одновременно. Вдохновленные успехами «квадруплекса» Томаса Эдисона, многие изобретатели начали эксперименты с «гармоническим телеграфом». Сообщения передавались с помощью набора магнитных стерженьков, каждый из которых колебался со своей частотой. В число экспериментаторов входили Элиша Грей из Огайо и Александр Грэхем Белл из Бостона. Они практически одновременно создали работоспособную схему с использованием уже не размыкателя цепи, а элемента, способного изменять свое сопротивление непрерывно, — электрического провода, опущенного в проводящую жидкость. Оба изобретателя подали заявки на патент в один день — 14 февраля 1876 года, но Белл успел сделать это на пару часов раньше. В результате именно он получил 7 марта 1876 года патент № 174465 с формулировкой «Усовершенствование в области телеграфии».
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Телефон быстро стал пользоваться успехом. Несмотря на скептицизм и многочисленные патентные споры, к 1880 году в США количество аппаратов уже перевалило за 30 000.
Изначально Элиша Грей не стал оспаривать решение о выдаче патента Беллу по совету своих юристов, которые посчитали это изобретение малозначительным по сравнению с дальнейшим усовершенствованием «гармонического телеграфа». Правда, позднее этот вопрос послужил причиной множества споров и судебных исков, хотя ни одно расследование не смогло опровергнуть приоритета Белла. Скорее всего, изобретатели независимо пришли к очень похожим решениям. К тому же Белл в своей заявке уделил основное внимание другой схеме — с использованием электромагнитов, фактически прообраза современных динамиков. А схему с проводящей жидкостью он использовал только один раз — чтобы продемонстрировать саму возможность передачи голоса с помощью электричества: 10 марта 1876 года Александр Грэхем Белл включил аппарат и сказал своему помощнику Томасу Уотсону, находившемуся в соседней комнате, фразу, вошедшую в историю техники: «Мистер Уотсон, подойдите ко мне, вы мне нужны!». О фразах, которые Элиша Грей сказал своим юристам, история умалчивает.
Как работает телефон
Когда человек говорит по телефону, его голос может быть слышен так же ясно и отчетливо, как если бы говорящий находился в соседней комнате, а не за тысячу миль от абонента. Когда-то телефонные голоса часто звучали удаленно, заглушались скрежетом и шумами. Голос мог неожиданно заскрипеть так, что говорящий вдруг обнаруживал себя общающимся с совершенно незнакомым человеком.
Современные телефонные системы редко сталкиваются с такими проблемами; использование компьютеров обеспечивает качество звука и его обособленность. С этой целью компьютеры преобразуют голос в цифровую цепочку, смешивая ее с тысячами других таких же цепочек на протяжении короткого пути. Код идентифицирует каждый голос и сообщает телефонной компьютерной системе, чей это голос, куда он следует и как он звучит. Код все время остается неизменным. Когда голос достигает места назначения, от отделяется от других голосов и звучит так же чисто, как и в первый момент поступления на телефонную линию.
Звук — в электрический сигнал.
Внутри приемной части телефонной трубки вибрация голоса генерирует электрический ток, который является аналоговым сигналом голоса.
Аналоговые и цифровые сигналы
Компьютер преобразует аналоговый волновой сигнал в цифры и делит их на восьмибитовые цепочки, или байты, которые способны представить 256 различных звуковых уровней. Последовательное чередование отсутствия и наличия напряжения соответствует цифрам 1 и 0.
Из цифр — в звуки
Преобразователь в телефонном приемнике превращает цифры в звуковые волны. Когда голосовой поток поступает в приемник, электромагнитная обмотка сильно или слабо активизируется. заставляя диафрагму приемника воспроизводить звуковой сигнал.
Воспроизведение голоса
Битовые цепочки из множества различных голосов смешаны в одном потоке. Тысячи голосов идут по одной телефонной линии и не смешиваются. Битовые цепочки, составляющие первый голос (красный цвет), отделены от цепочек других голосов. Аппаратура телефонной станции улавливает их из потока и организует таким образом, чтобы голос мог быть восстановлен. Наконец, компьютер преобразует цифровой сигнал в электрический аналоговый сигнал.
Популярные материалы из данной категории:
BPWin. Лабораторная работа №1
Тема: Знакомство с CASE-средством разработки информационных систем BPwin Цель работы: познакомиться с CASE-средством BPwin фирмы Computer Associates, научиться строить модель в методологии IDEF0 . Порядок работы:1. Ознакомиться с принципами построения модели…
Что такое двоичный код?
Всем известно, что компьютеры могут выполнять вычисления с большими группами данных на огромной скорости. Но не все знают, что эти действия зависят всего от двух условий: есть или нет ток и какое напряжение.
Кто изобрел первый калькулятор?
Интеллектуальное брожение в 17 веке привело к новым высотам и открытиям в математике, что значительно облегчило труд тех, кто неустанно разрабатывал калькуляторы.
Виды корпусов и блоков питания системного блока
Системный блок – корпус компьютера, в котором находятся основные элементы персонального компьютера или сервера. Его задача в защите внутренней компоновки компьютера от воздействия извне и механических повреждений. Так же не маловажное назначение системного…
Как работает мобильный (сотовый) телефон
Связь мобильных, или, как их еще называют, сотовых, телефонов осуществляется не при…
Как работает факс
Факсимильная, или факс машина была изобретена в 1842 году, но популярность обрела лишь в…
Как работает пейджер
Как и сотовые телефоны, электронные пейджеры передают и принимают сигналы при помощи…
Как работает клавиатура компьютера
В большинстве компьютерных систем клавиатура является панелью управления, через которую…
Как работает спутниковая связь
Запущенные в космос спутники связи, как правило, поступают на геостационарные орбиты, то…
Как работает компьютерная мышь
Мышь является одним из инструментов, которые могут быть подсоединены к компьютеру для…
Как устроены интегральные схемы
Компьютеры строятся на основе двух типов интегральных схем: логической и ЗУ (запоминающее…
Как происходит аналого-цифровое преобразование
Мир полон изменяемых величин. Некоторые величины изменяются непрерывно, некоторые шаг за…
Как работает смартфон во время совершения вызова?
- Технологии
- 29 марта 2018
Наши коллеги с канала Stupidmadworld решили разобраться с тем, как работает смартфон в процессе совершения звонков. Причем сделать это они решили настолько дотошно, что начали с момента, когда нажимается кнопка разблокировки экрана. В этом материале мы публикуем лишь часть описанного ребятами процесса, который касается работы смартфона непосредственно в момент совершения звонка. А все, что происходит внутри наших любимых девайсов до нажатия на кнопку вызова и после можно посмотреть в видео на канале SMW или в конце статьи.
Работа радиомодуля и SIM-карты при вызове
Для совершения звонков в смартфоны устанавливают специальные радиомодули или модемы, которые практически всегда находятся в состоянии связи с сотовой сетью. Постоянная связь нужна для того, чтобы в любой момент можно было принять входящий звонок, ну или быстро совершить исходящий.
Но без SIM-карты радиомодуль бесполезная штука. Именно по SIM-карте оператор сотовой сети идентифицирует абонентов, которые постоянно куда-то звонят. Чтобы осуществить идентификацию, на специальные контакты на SIM-карте подается небольшое напряжение. Его достаточно для работы собственного микропроцессора, оперативной и постоянной памяти, расположенных внутри SIM-карты, а также для небольшого набора программ.
Может показаться, что внутренняя память SIM-карты нужна для хранения информации о балансе, остатке трафика, подключенном тарифе и услугах, но это не так. Один из блоков памяти SIM используется для хранения ключей шифрования и номера IMSI. Эта аббревиатура расшифровывается как International Mobile Subscriber Identity и переводится как международный идентификатор мобильного абонента. Именно этот идентификатор связан в базе данных оператора с номером телефона абонента. Этот блок памяти нельзя перезаписать, но есть и другой, который можно использовать для хранения контактов и SMS. В наш век облачных хранилищ, на SIM-картах эти данные уже никто не хранит.
Базовые станции сотового оператора
Итак, в момент совершения вызова и подачи напряжения на SIM-карту активируется сигнал, который передается радиомодулем на антенну смартфона. Она призвана усилить сигнал и передать его на ближайшую к абоненту базовую станцию сотового оператора. Эти станции располагаются на различных зданиях и возвышенностях для того, чтобы гарантировать абонентам покрытие сети и возможность осуществлять и принимать вызовы. Момент сигнального обмена с базовой станцией по сути является запросом на соединение с вызываемым абонентом. В эту же секунду передается номер телефона вызывающего абонента, который видит на своем смартфоне абонент, принимающий звонок.
Процесс связи между разными базовыми станциями, рядом с которыми находятся абоненты тоже очень сложный. Но если говорить об этом вкратце, то базовая станция отправляет запрос на контроллер (BSC или Base Station Controller), который уведомляет о поступившем вызове и переадресует запрос на коммутатор (MSC или Mobile Switching Center). Задача коммутатора в данном контексте заключается в обработке вызова, сверке с базой данных с информацией об абонентах (HLR или Home Location Register), выяснении местоположения вызываемого абонента и передачи сигнала на соответствующий коммутатор. Далее процесс разворачивается и в обратной последовательности сигнал о вызове через базовую станцию вызываемого абонента передается на его смартфон.
Входящий вызов
При получении вызова активируются различные модули смартфона. Во-первых, антенна улавливает сигнал и преобразовав его в электрический импульс передает на радиомодуль. Во-вторых, радиомодуль оповещает процессор смартфона о входящем звонке. Ну в-третьих, процессор активирует экран, меню режима звонка на экране, уведомление о входящем вызове и эксцентрик, который более известен, как вибромотор.
Наконец, абонент отвечает на вызов нажатием на зеленую кнопку и произносит: — Алло. Микрофон смартфона улавливает этот звук и преобразовывает его в электрический импульс, который по той же самой схеме отправляется назад собеседнику за какие-то доли секунды.
Что все это значит?
Вспомните, сколько времени проходит с момента, когда вы решаете совершить звонок со своего смартфона, до момента, когда собеседник на него ответил? Не более 7-10 секунд в среднем. Но за этот короткий промежуток времени в смартфоне происходит огромное количество процессов, которые позволяют нам быстро и просто общаться друг с другом. Технический прогресс позволяет нам сокращать время для передачи важной информации друг другу и смартфоны служат отличным инструментом для этого. И как символ нашей эпохи — смартфон является отличным доказательством победы разума и технологий.
В первой части цикла статей мы рассмотрели преобразование человеческого голоса в электрический сигнал. Теперь, казалось бы, самое время передать этот сигнал до местонахождения собеседника и начать разговор! Именно так первоначально и поступали. Однако чем более востребованной становилась услуга и чем на большие расстояния было необходимо передавать сигнал, тем понятнее становилось, что аналоговый сигнал для этого не годится.
Для того чтобы обеспечить передачу информации на любое расстояние без потери качества, нам потребуется произвести второе преобразование из Аналогового сигнала в Цифровой.
Эта картинка дает самое наглядное представление о том, что происходит при Аналогово Цифровом Преобразовании (АЦП) а далее мы рассмотрим зачем это нужно, как происходило развитие технологии, и какие требования накладываются на такое преобразование в мобильных сетях.
Те, кто пропустил или подзабыл, о чем шла речь в первой части, могут вспомнить Как мы получили из звуковых колебаний электрический сигнал, а мы продолжим описание преобразований, перемещаясь по картинке, на которой обозначена новая область, интересующая нас в данный момент:
Сначала давайте поймем, зачем вообще нужно преобразовывать аналоговый сигнал, в какие-то последовательности нолей и единичек, которые без специальных знаний и математических преобразований и услышать невозможно.
После микрофона у нас есть аналоговый электрический сигнал, который можно с помощью динамика легко «озвучить», что, собственно, и производилось в первых опытах с телефонами: обратное преобразование «электрический сигнал – звуковая волна» выполняли в том же помещении или на минимальном расстоянии.
Только для чего нужен такой телефон? В соседнее помещение можно донести звуковую информацию без всяких преобразований – просто повысив голос. Поэтому появляется задача – услышать собеседника на максимальном расстоянии от инициатора разговора.
И вот тут в силу вступают неумолимые законы природы: чем больше расстояния, тем сильнее электрический сигнал в проводах затухает, и через какое-то количество метров/километров восстановить из него звук будет невозможно.
Те, кто застал городские проводные телефоны, работающие с декадно-шаговыми АТС (аналоговыми телефонными станциями), прекрасно помнят, какое качество голоса порой предоставлялось с помощью этих аппаратов. А кто-то может вспомнить и такие всеми забытые экзотические включения «через блокиратор» / «параллельный телефон», когда два телефона в одном доме включались на одну телефонную линию, при этом, когда один абонент занимал линию, второй был вынужден ждать окончания его разговора. Поверьте – это было нелегко!
То есть для увеличения количества одновременных вызовов между двумя точками, с использованием аналоговых линий нам требуется прокладывать все больше и больше проводов. К чему это может привести, можно оценить по городским пейзажам начала прошлого века:
Поэтому сразу после изобретения телефона, лучшие инженеры взялись за решение задачи: как передать голос на большие расстояния с максимальным сохранением качества и минимальными затратами на оборудование.
Что же нам необходимо для того, чтобы непрерывный аналоговый электрический сигнал превратился в дискретный, закодированный последовательностями нолей и единиц, и при этом передавал информацию максимально приближенную к оригиналу?
Немного теории.
Чтобы преобразовать любой аналоговый сигнал в цифровой, необходимо через определенные промежутки времени (шаг дискретизации на картинке ниже) зафиксировать амплитуду сигнала с определенной точностью (шагом квантования).
После оцифровки получится ступенчатый график, показанный на рисунке. Для максимального приближения оцифрованного сигнала к аналоговому необходимо шаг дискретизации и шаг квантования выбирать как можно меньше, при бесконечных значениях мы получим идеально оцифрованную запись.
На практике бесконечная точность оцифровки не требуется, и нужно выбрать, какая точность может считать достаточной для передачи голоса с требуемым качеством?
Здесь нам на помощь придут знания о чувствительности человеческих органов слуха: принято считать, что человек может различать звуки с частотой от 20Гц до 22.000Гц. Это граничные значения для дискретизации, которые позволят передать любой звук, воспринимаемый человеком. Если перевести Гц в более привычные секунды – получим 0,000045 секунды, то есть измерения необходимо производить каждые 4,5 сто-тысячных секунды! Более того – и этого оказывается недостаточно. О причинах и требуемых значениях частоты дискретизации расскажем чуть ниже.
Теперь определимся с шагом квантования: шаг квантования позволяет присвоить в каждый момент времени определенное значение амплитуды измеряемому сигналу.
В первом приближении можно просто проверять наличие или отсутствие сигнала, для описания такого количества вариантов нам будет достаточно всего двух значений: 0 и 1. В информатике это соответствует количеству информации: 1 бит и битность записи будет равна 1. Если оцифровать любой звук с такой битностью, на выходе мы получим прерывистую запись, состоящую из пауз и звука одного тона, вряд ли это можно назвать записью голоса.
Поэтому придется увеличить количество измеряемых вариантов амплитуды, например, до 4 (то есть до 2 бит – 2 в степени 2): 0 — 0,25мА – 0,5мА – 0,75мА.
С такими значениями уже можно будет различить некоторые изменения звука после оцифровки, а не только его наличие или отсутствие. Иллюстрация прекрасно показывающая, что дает нам увеличение битности (квантования) при оцифровке звука, приведена на этом рисунке:
Теперь, увидев в свойствах музыкального файла цифры 44 кГц/16 бит, вы можете сразу понять, что Аналогово-Цифровое Преобразование производилось с дискретизацией 1/44кГц = 0,000023 секунды и с глубиной квантования 2 в 16 степени – 65.536 вариантов значений.
Первые схемотехнические решения для выполнения АЦП-ЦАП преобразований были как всегда большими и медленными:
Сейчас эти задачи выполняются в основном процессоре мобильного телефона, который одновременно справляется с огромным количеством других задач:
Если провести оцифровку без дополнительной оптимизации полученной цифровой модели, объем полученных данных будет очень велик, достаточно вспомнить, сколько места на вашем диске может занять звуковой файл в несжатом виде. Стандартный CD, для примера, это 780 мегабайт информации и всего 74 минуты звука!
После обработки такого файла с применением алгоритмов оптимизации и сжатия с потерями данных (например, mp3) объем файла можно снизить в 10 и более раз.
Для наших целей объем получаемых данных имеет принципиальное значение, поскольку их еще необходимо передать до вашего собеседника, и ресурс транспортного канала очень ограничен.
Вновь задача для инженеров – максимальная оптимизация объема передаваемых данных с сохранением требуемого качества.
В разговорной речи, которая звучит во время телефонного диалога, спектр частот существенно ниже доступного для восприятия, поэтому для передачи телефонного разговора можно ограничиться более узким спектром: например 50..7000Гц. Про это мы достаточно подробно писали в материале о голосовых кодеках в мобильных сетях.
Теперь у нас есть исходные данные для начала преобразования – электрический аналоговый сигнал, в спектре 50-7000Гц, и нам необходимо провести преобразование А-ЦП, таким образом, чтобы искажение сигнала при преобразовании (те самые ступеньки на графике выше) не повлияло на качество записи. Для этого нужно выбрать значения шага дискретизации и шага квантования, достаточные для полного описания имеющегося аналогового сигнала.
Здесь нам на помощь придет одна из основополагающих теорем в области цифровой обработки сигналов — Теорема Котельникова.
В ней наш соотечественник математически обосновал, с какой частотой необходимо проводить измерения значений функции для её точного числового представления. Для нас важнейшее следствие данной теоремы заключается в следующем – измерения нужно проводить в два раза чаще самой высокой частоты, которую нам необходимо перевести в цифровой вид.
Поэтому шаг дискретизации для оцифровки разговора, будет достаточно взять на уровне 14 кГц, а для качественной оцифровки музыки — 2 х 22кГц, здесь мы и получаем стандартные 44кГц, с которыми сейчас, как правило, создаются музыкальные файлы.
Существует большое количество самых разнообразных голосовых кодеков, которые могут применяться в проводных и беспроводных сетях, причем кодеки для проводных сетей, в общем случае, кодируют голос с лучшим качеством, а кодеки для беспроводных сетей (сетей мобильных операторов) — с немного худшим качеством.
Зато эти кодеки генерируют дополнительные данные, для восстановления получаемого сигнала в случае неуспешной доставки из-за сложных радиоусловий. Эта особенность называется помехозащищенностью, и развитие кодеков для мобильных сетей происходит в направлении улучшения качества передаваемого сигнала с одновременным увеличением его помехозащищенности.
В мобильных сетях используются целые классы голосовых кодеков, которые включают в себя набор динамически выбираемых скоростей кодирования, в зависимости от текущего положения абонента и качества радиопокрытия в этой точке:
В таблице перечислены все кодеки, используемые в современных мобильных сетях, из них кодеки с динамическим битрейтом (в которых меняется соотношение полезных данных и избыточных для восстановления данных) имеют название AMR – Adaptive Multi Rate. Кодеки FR/HR/EFR используются только в сетях GSM.
Чтобы наглядно представить насколько больше данных кодируется в высокоскоростных кодеках, взгляните на следующую картинку:
Переход от кодеков класса AMR к AMR-WB почти удваивает количество данных, а AMR-WB+ требует еще на 40-50% больше ширины транспортного канала!
Именно поэтому в мобильных сетях широкополосные кодеки в мобильных сетях еще не нашли широкого применения, но в будущем возможен переход на Super Wide Band (AMR-WB+) и даже на Full Band полосу, к примеру для онлайн трансляций концертов.
Итак – после выполнения второй стадии преобразования голоса, мы вместо звуковых колебаний получаем поток цифровых данных, готовых к передаче через транспортную сеть.
До момента обратного преобразования цифр в аналоговый сигнал эти данные сохраняются почти без изменений (иногда в процессе доставки голоса может происходить перекодировка из одного кодека в другой), и дальнейшие преобразования происходящие с нашим голосом, будут касаться физической среды через которую передается вызов.
В следующем материале мы рассмотрим, что происходит между телефоном и базовой станцией и каким чудесным образом сформированный нами поток данных без проводов доставляется до оборудования оператора.
P.S. Всем кому интересна тема цифровой связи и история её развития, крайне рекомендую книгу «И мир загадочный за занавесом цифр» авторы Б.И.Крук, Г.Н.Попов. С точки зрения современных стандартов и технологий она немного устарела, но теоретическую и историческую часть авторы описывают прекрасно, разбавляя сухую теорию живыми примерами и иллюстрациями.
Пятница, братья и сестры, а по пятницам у нас подкаст с конспектом. Подкаст «Запуск завтра» выходит при поддержке Практикума, а мы тоже выходим при поддержке Практикума, поэтому синергия. Сегодня говорим об устройстве сотовой связи. Слушайте подкаст, если есть время, а если нет — читайте основные мысли ниже.
О герое
Герой выпуска — Александр Чемерис, сотрудник компании YADRO. Руководил стартапом Fairwaves, где делал оборудование для сотовых операторов, обеспечивал связью африканские деревни и штат Оахака в Мексике.
Как Александр попал в мир сотовой связи
Я начал заниматься сотовой связью через софт. Писал диплом по коммуникациям Voice over IP (VoIP). Это возможность говорить голосом через интернет, например как в Skype или Telegram. Потом появился опенсорсный проект Open BTS, который, с помощью VoIP и железа под названием Software-Defined Radio позволял сделать сотовую станцию. Мы с приятелем подумали: «Это же прикольно!». Купили такую карточку и попробовали это дело запустить. Так я из софта перешёл в сотовую связь.
Оказалось, что сотовая связь — это отдельный мир, который можно изучать годами. Ты в него погружаешься, а потом раз — и десять лет прошло.
Как устроена сотовая связь
Она работает на радиоволнах. Вот как мы голосом говорим — и голос распространяется по воздуху на расстоянии. У радиоволн похожий принцип, но распространяются они гораздо дальше, воздух им не мешает. Ушами мы радиоволны слышать не можем, но в телефонах есть специальные антенны, которые умеют воспринимать эти колебания.
Почему по сотовому мы можем говорить одновременно
ТВ-вещание либо радиовещание — это симплексная связь, то есть односторонняя. Один источник сигнала облучает какую-то местность, и все приёмники в этой местности «слышат» этот сигнал.
Сотовая связь — это дуплексная связь, двусторонняя. В сотовой связи есть «канал вверх» и «канал вниз», они так и называются — uplink и downlink. Вниз — это канал к абоненту, потому что вышка обычно выше него, а вверх, соответственно, от абонента туда, наверх, в сторону вышки.
Два самых популярных способа разделения — это frequency division duplex и time division duplex, FDD и TDD соответственно. Классическая сотовая связь построена на FDD, когда у тебя на одной частоте телефон принимает, а на другой передаёт. То есть у тебя словно два радио на разных частотах: по одному ты передаёшь сигнал, по другому — передаёт вышка.
TDD — это то, что мы сейчас делаем. Пока я говорю, ты молчишь, когда ты говоришь, я молчу. Когда все начинают говорить одновременно, происходит интерференция — становится плохо слышно, у тебя начинает квакать телефон.
Стандартный TDD в сотовой связи построен на фреймах, где длина одного фрейма в 4G — 10 миллисекунд, в 5G — до одной миллисекунды. Дальше 10 миллисекунд разбиваются на uplink и downlink, ты 5 миллисекунд говоришь и 5 миллисекунд слушаешь. Это настолько мало, что тебе кажется: ты в любой момент можешь начать говорить, не надо ждать собеседника.
Какие железки отвечают за передачу сигнала
Исключая абонентские устройства, сеть состоит из трёх компонентов: софт у оператора, базовые станции на вышках и связь между ними — транспортная сеть, или бэкхолл.
Вышка обычно подключена к мощному источнику электроэнергии. У неё большие антенны, которые усиливают сигнал. Ты физически не можешь носить телефон, у которого антенна два метра, поэтому антенна на вышке всегда большая. Если сравнить мощность излучения, то у телефона она намного меньше, чем у вышки. Это отчасти связано с какими-то медицинскими нормами, но на самом деле просто экономически невыгодно делать телефон, который будет передавать мощный сигнал: у него будет быстро садиться батарейка.
Роль вышки — передать и принять сигнал с телефона. Причём сделать это качественно и так, чтобы телефон садился не за два часа, а за пару дней хотя бы. Вышка — это физическое устройство, которое ты видишь на улице, а есть базовая станция — это то, что находится на вышке. Если поставить одну такую базовую станцию в центре деревни, то у всех людей нормально будут работать телефоны, которые находятся в зоне доступа. А если навтыкать вышки рядом друг с другом, то начнутся проблемы со связью.
Почему сеть называется «сотовая»
Потому что у тебя вышки натыканы как медовые соты, а вокруг базовой станции зона приёма словно шестиугольник.
Есть целая наука и отдельные люди, которые занимаются радиопланированием. Они делают, так чтобы базовые станции друг другу не мешали и всё это хорошо работало. Говоря математически, если у тебя сотовые вышки передают с одинаковой мощностью, то оптимальное распределение этих вышек будет такое, что каждая стоит в центре шестиугольника. Если ты построишь изолинии равной мощности, то там, где мощность одной вышки падает настолько, что мощность второй вышки начинает вырастать, ты увидишь, что изолинии образуют шестиугольник. Это действительно так физически устроено и выглядит как соты.
Сейчас всё сложнее. Появились макростанции, пикостанции, маленькие станции, зонтичные станции, фемтостанции, которые можно дома поставить.
«Прогресс дошёл до того, что базовые станции учатся договариваться между собой, кто когда передаёт. Условно говоря, маленькая базовая станция, фемтосота, у тебя в квартире в какой-то момент может сказать большой сотовой станции, которая стоит за окном: „Слушай, я буду передавать вот в такое время, вот на такой частоте, ты помолчи. В мою сторону не свети, я тут сейчас дело сделаю, а потом продолжишь“».
Кому принадлежат вышки
Не хочу углубляться в эту тему, это целая отдельная индустрия башенных компаний. Они продают то, что по-английски называется vertical real estate. По-русски это будет «вертикальная жилплощадь». Есть целое понятие — BTS Hotel, то есть отель базовых станций. Ставишь такую вышку, а дальше сдаёшь в ней номера.
В России по закону базовая станция должна принадлежать мобильному оператору, иначе её не разрешат вывести в эфир. Но бывает и по-другому. Например, Tinkoff Mobile — это виртуальный мобильный оператор. У него есть бренд, но нет своих базовых станций, то есть он с кем-то договорился. А настоящий мобильный оператор — это компания, которая владеет лицензией на частоты. Диапазон частот делится на маленькие кусочки и продаётся по частям за бешеные деньги разным операторам связи.
«В связи с появлением 5G в Америке был крупный аукцион, где платили десятки миллиардов долларов за право работать на определённых частотах. В России аукцион частот — такой же способ заработать денег для государства. Можно собирать налоги, а можно продавать частоты».
Кто помимо государства в России владеет частотами
Из федеральных операторов, которые присутствуют в подавляющем большинстве регионов России, «большая четвёрка»: «МегаФон», «МТС», «Билайн» — он же VEON, и «Ростелеком» — он же «Теле2». Осталось несколько мелких региональных операторов, остальных выкупили крупные московские и питерские компании.
В чём отличие 1G от 5G
G — это Generation, «поколение». Новое поколение сотовой связи появляется примерно раз в десять лет. Нужно всё стандартизировать, изготовить оборудование, развернуть его и получить частоты. Это длительная процедура.
Сеть 1G появилась в 1979 году. Главная инновация была в том самом подходе, когда вышки ставятся по сотовому принципу. Сеть второго поколения 2G — это переход к цифровым коммуникациям, что позволило повысить ёмкость и безопасность. Повысилось количество абонентов и стало невозможно при помощи аудиоприёмника подслушать, о чём люди говорят по телефону.
Сеть третьего поколения научилась нормально передавать интернет. Без 3G не было бы iPhone с его приложениями. 4G изначально задумывалась для интернета, а не для голоса. До сих пор во многих сетях 4G ты не можешь поговорить голосом. С этим помогает LTE — конкретная реализация голосовой связи, которая стала доминирующей.
В 2019 году начали появляться самые первые 5G — это попытка улучшить 4G, подстроить под промышленные юзкейсы.
Первый юзкейс Massive IoT — условно, 10 тысяч устройств на квадратный километр. Используется на заводе, который обвешан датчиками. Второй юзкейс — Ultra Reliable Low Latency Communications. Это управление робототехникой, телемедицина, удалённое управление поездами, гейминг. Третье — это то, что называется Mobile Broadband, более быстрая передача данных.
Как родилась идея для стартапа
Люди на какой-нибудь шахте либо на нефтяной вышке тоже хотят говорить друг с другом по сотовому или, что ещё сложнее, звонить домой. Им нужно дать для этого инструмент. Одна базовая станция на какой-нибудь нефтяной вышке для монстра типа Nokia или Ericsson вообще не важна. Но для небольшой компании, если посчитать, это интересный бизнес-кейс.
Мы работали с легитимными сотовыми операторами. У них есть частоты, но есть проблема с тем, что на оборудовании крупных вендоров им невыгодно идти в деревню. Чтобы сделать связь в таких удалённых регионах, я продавал решение — оборудование и софт. Физически это выглядит как ребристая коробочка около 10 кг размером с небольшой рюкзак. Я её как раз в рюкзаке с собой и таскал на презентации.
Внутри такой базовой станции компьютер и радиокомпоненты. Стоит разъём под большую внешнюю антенну, которую покупаешь отдельно. Антенны бывают разные. Ты выбираешь нужную под ландшафт и местность и затем прикручиваешь к вышке. Дальше прикручиваешь базовую станцию и соединяешь толстым радиокабелем с антенной.
В стандартной африканской деревне вышки с разумными антеннами покрывают радиус 5–7 километров. Это размер небольшого города или деревни. К такой базовой станции можно подключить дешёвую Nokia или даже iPhone.
Почему стартап закрылся
Мы не выдержали гонку с более обеспеченными стартапами. Сначала были богатые TIER 1 и несколько небольших компаний по всему миру. Мы все друг друга знали. С одной стороны, мы всегда соревновались, с другой — были против тех мужиков в костюмах от монополистов.
Потом сработала трамповская война против Китая, которая привела к тому, что начал разваливаться единый телекоммуникационный мир. Индустрия поделилась на национальные анклавы. В Европе остались Ericsson и Nokia. В Штатах появились хорошо профинансированные стартапы. Параллельно такие же процессы начали происходить в Индии. Начали появляться национальные разработчики в Японии и во Вьетнаме.
Мой стартап назывался Fairwaves — «Справедливые волны». Я проработал там практически десять лет. Сейчас мы занимаемся тем же самым, чем занимались раньше, — создаём оборудование для операторов сотовой связи, только теперь не для США, а для России.
В полной версии подкаста
14:00 Как победить интерференцию
18:00 Почему мегагерцы стоят денег
27:00 Как наследственность в сотовой связи сделала её уязвимой
33:10 Что означают все эти G
38:00 Почему, когда говоришь по 4G, интернет виснет
43:42 Как развернуть свою локальную сеть
51:20 Вышка из бамбуковой палки и государственная монополия на связь. Что Саша делал в Мексике
58:30 Почему Саша закрыл стартап
Вёрстка:
Кирилл Климентьев