Лабораторная 2: LZW (TIFF)

Написать функцию, выполняющую декодирование сжатых LZW данных (вариант из стандарта TIFF).

Прототип функции:

size_t lzw_decode(const uint8_t *in, size_t in_size, uint8_t *restrict out, size_t out_size);

Возвращаемое значение: количество декодированных байт или -1 при ошибке.

Детали реализации

Небольшой комментарий по поводу моего (Белоус Д.П.) решения.

Реализация 64-битная, помимо этого никакие расширения не используются.

Таблица кодов (декодированных строк) хранится как (длина, первый_символ, значение), где значение — либо явно хранящаяся строка, либо указатель на место в out, куда эта строка уже когда-то была напечатана. Т.е. в решении используется small-object оптимизация.

ветка slow — не использует out_size, печатает маленькие строки аккуратно (с помощью switch-case), но медленно;
ветка main, основная — не выходит за границы out буфера, печатает маленькие строки аккуратно только если мы пишем в конец буфера;
ветка fast — может вылезти на <= 7 байтов за границу out буфера, печатает всегда по 8 байтов за раз.

Вывод группами по 8 байтов (даже если декодированная строка на самом деле имеет меньшую длину) позволяет существенно ускорить программу. Если строка имела, например, длину 3 байта, то оставшиеся 7 байтов будут заполнены мусором (который потом затрётся корректным выводом следующих декодированных строк).

Другие использованные микро-оптимизации:

выровненное чтение по 4 байта;
cache/memory-friendly код, т.е. выравнивание по 8 байт обращений к стеку (добавление padding'а где нужно), alignment констант (dd);
минимизация условных, абсолютных, и косвенных переходов, особенно switch-case'ов;
где-то чуть-чуть копипасты (но прирост к производительности), где-то дополнительный условный переход, но зато он хорошо предсказывается и обходит свитч;
использование lea вместо add/mult с константой и подобные маленькие хитрости;
breaking regestry dependency chain.

Другие комментарии можно найти непосредственно в lsw64.asm

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
.github		.github
test_data		test_data
.gitignore		.gitignore
README.md		README.md
lzw64.asm		lzw64.asm
lzw64_fast.asm		lzw64_fast.asm
lzw64_fast_no_checks.asm		lzw64_fast_no_checks.asm
lzw64_slow.asm		lzw64_slow.asm
tmain.c		tmain.c
tmain_local.c		tmain_local.c

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Лабораторная 2: LZW (TIFF)

Детали реализации

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

belous-dp/asm-lzw-decoder

Folders and files

Latest commit

History

Repository files navigation

Лабораторная 2: LZW (TIFF)

Детали реализации

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages