Массивы

Данные Разработка Безопасность Инфраструктура Курсы и книги

10.17. Массивы

awk поддерживает одномерные массивы. Массивы и элементы массивов нет необходимости объявлять. Индексы массива могут быть числом или строкой. Пример условного обозначения числового индекса:

	x[NR] = $0

присваивает текущую строку вводного файла элементу NR массива x.

Фактически возможно считать целый вводной файл в массив с помощью программы awk:

              { x[NR] = $0 }
        END   { ... обработка ...}

Первое действие только записывает каждую строку вводного файла, отмеченную номером строки, в массив x, обработка выполняется в операторе END.

Элементы массива могут именоваться с помощью нецифровых величин. Например, следующая программа накапливает общее количество населения Asia и Africa в соответветствующий массив pop. Оператор END печатает общее количество населения этих двух континентов.

        /Asia/          { pop["Asia"] += $3 }
        /Africa/        { pop["Africa"] += $3 }
 END {     print "Asian population in million is", pop[Asia]
       print "African population in million is", pop[Africa]
     }

Результат получим следующий:

      Asian population in million is   1765
      African population in million is   37

В этой программе, если вы воспользуетесь pop[Asia] вместо pop["Asia"], то выражение будет использовать значение переменной как индекса, и так как значение переменной не установлено, то количество населения будет накапливаться в pop[""].

Предположим, нужно определить общую площадь каждого континента из файла countries.

Каждое выражение может быть использовано как индекс при ссылке в массиве. Так:

	area[ $4 ] += $2

использует строку в 4-м поле текущей записи вводного файла для индексирования массива area, накапливая значение второго поля:

        BEGIN  { FS = "\t" }
               { area[$4] += $2 }
        END    { for (name in area)
                     print name, area[name] }

Относительно файла countries получим результат:

          Asia  13611
          North America 7467
          South America 4358
          Australia 2968
          Africa 1888

Эта программа использует следующую форму оператора, который организует итерации для нахождения индекса в массиве:

	for ( i in array ) оператор

выполняется "оператор" с переменной i , для которой определен array[i]. Цикл выполняется для каждого определенного индекса, который выбирается в произвольном порядке.

awk не поддерживает многомерные массивы, но допускает список индексов. Они объединяются в один индекс значениями, разделенными строкой (хранимой в переменной SUBSEP).

Например:

          for ( i = 1; i <= 10; i++ )
               for ( j = 1; j <= 10; j++ )
                    arr[i, j] = ...

создает массив, который ведет себя как двумерный массив. Индексом является сочетание i, SUBSEP и j.

Вы можете определить, появляется ли конкретное i в массиве arr:

	if ( "Africa" in arrea ) ...

Это условие приведет к выполнению тестирования без создания массива ["Africa"]. Этот массив создался, бы если использовалось

	if ( area ["Africa"] != "" ) ...

Возможно также разбить любую строку на поля, которые станут элементами массива. Это можно сделать с помощью встроенной функции split:

	split ( "s1:s2:s3", a, ":" )

split разбивает строку на 3 поля, используя в качестве разделителя ":" и сохраняя s1 в [1], s2 - в [2], s3 - в [3]. Возвращаемое значение этого оператора равно числу полей, т.е. трем. Третий аргумент функции split - это регулярное выражение, будет использоваться как поле разделителя. Если третий аргумент отсутствует, то в качестве поля разделителя будет использоваться FS.

Массив элементов может быть разделен с помощью аргумента delete:

	delete имя_массива [индекс]

Назад | Содержание | Вперед

Новости IT

24 июля 2026

AlphaFold 3 помог повысить точность базовых редакторов генома

24 июля 2026

Выручка Intel выросла на 25% — максимальными темпами более чем за 15 лет

24 июля 2026

Meta, Microsoft и Nvidia выступили против широких ограничений на модели с открытыми весами

24 июля 2026

NVIDIA ускорила развёртывание LLM с помощью передачи весов между GPU

24 июля 2026

Sakana AI обновила оркестратор моделей Fugu Ultra и добавила интерфейс для Claude Code

24 июля 2026

Разработчики Soofi S признали попадание тестов GPQA в обучающие данные

24 июля 2026

Google подписала кодекс ЕС о маркировке контента, созданного ИИ

24 июля 2026

Anthropic выпустила Claude Opus 5 с ценой вдвое ниже Fable 5

24 июля 2026

AMD запустила ИИ-систему Helios с 72 ускорителями Instinct MI455X

24 июля 2026

Kimi K3 уступила ведущим американским ИИ-моделям в разработке эксплойтов

24 июля 2026

Модели Huawei и RedNote набрали 42 из 42 баллов при проверке решений IMO

23 июля 2026

«Яндекс» тестирует голосовую ИИ-хостес для приёма звонков и бронирований

23 июля 2026

Капзатраты Alphabet на ИИ впервые увели квартальный свободный денежный поток в минус

23 июля 2026

Intel и AMD договариваются с клиентами из КНР о долгосрочных закупках серверных CPU

23 июля 2026

Runway запустила маршрутизатор моделей для генерации изображений, видео и аудио

23 июля 2026

Лунные роверы Lunar Outpost получат вычислительные модули Nvidia Jetson

23 июля 2026

Google начала обучение Gemini 4 и делает ставку на более крупную базовую модель

23 июля 2026

«Росэл» оценил парк промышленных роботов в России в 32–34 тысячи единиц

23 июля 2026

NVIDIA DGX GB300 запустили в Военно-морской школе последипломного образования США

23 июля 2026

Квартальная выручка IBM Z упала на 42% из-за переноса закупок мейнфреймов

Все новости →

Связь с редакцией