화요일, 12월 11, 2007

Linux Assembly Code

Linux Assembly Code

글쓴이 : 이호 (i@flyduck.com)
최신 글이 있는 곳 : http://linuxkernel.net/

v0.1.1 2000년 4월 8일
v0.1.0 2000년 3월 28일

차례

* 0. 서문
* 1. GAS와 AT&T 문법
* 2. Inline Assembly
* A. Reference


0. 서문
이 문서는 리눅스에서 사용하는 어셈블리 문법에 대해서 (특히 x86에서) 간략히 요약한 글입니다. 리눅스에서 사용하는 어셈블리 코드는 Intel/Microsoft에서 사용하는 어셈블리 코드와 차이를 보입니다. 문법도 서로 틀릴 뿐만 아니라, C 코드 중간에 사용하는 inline 어셈블리 코드의 사용법도 많은 차이를 보입니다. 이 글은 리눅스에서 어셈블리 코드를 작성하는 법이 아니라, 이미 어셈블리어에 대해서 어느정도 지식이 있다는 가정하에, 리눅스 용으로 작성된 어셈블리 코드를 읽는 법을 다룹니다.

1장. GAS와 AT&T 문법에서는 GAS에서 사용하는 AT&T 문법이 Intel/Microsoft에서 사용하는 문법과 어떤 차이가 있는지를 설명합니다. AT&T 문법은 Intel에서 사용하는 문법과 많은 차이를 보이는데, 여기서 비롯되는 혼동을 없애려고 합니다. 이 장은 인텔에서 사용하는 어셈블리어(Microsoft의 Macro Assembler나 Borland의 Turbo Assembler 등)를 알고 있다면 많은 도움이 될 것입니다. 2장 Inline Assembly는 C 코드내에서 어셈블리 코드를 사용하는 방법에 대한 글입니다. 커널 코드에서 CPU에 의존적인 부분들의 상당수는 inline 어셈블리 코드로 작성되어 있는데, 어셈블리어를 알고 있다고 하더라도 처음 접하는 경우 이 코드는 암호처럼 보이기도 합니다. 이 장은 GCC의 inline assembly 형식에 낯선 사람들이 이를 이해하는데 도움이 될 것입니다.

이 문서는 Linux Assembly HOWTO 문서와 Brennen's Guide to Inline Assembly, DJGPP QuickASM Programming Guide, GCC Manual, GAS Manual에 있는 내용을 요약 정리한 것입니다. 여기 등장하는 예제들 역시 앞의 글에 있는 코드들을 많이 참조한 것입니다. 되도록 꼭 필요한 내용을 중심으로 간결하게 정리하려고 하였으며, 더 자세한 설명을 바란다면 A. Reference에 나오는 문서들을 보시기 바랍니다. 실제 CPU 명령어에 대해서는 각 CPU 제조회사에서 제공하는 매뉴얼을 참조하시기 바랍니다. x86에서 사용하는 명령어는 Intel 홈페이지에 있는 (Intel Architecture Software Developer's Manual)이나 (Pentium Processor Family Developer's Guide)에 자세히 나와 있습니다.

이 글에서 잘못된 점을 발견하시거나 보충할 점이 있으면 언제든지 편지를 보내주십시오. 질문 및 대답은 홈페이지에 있는 게시판을 이용하시기 바랍니다. 그럼 리눅스를 공부하시는 분들께 도움이 되길 바랍니다.


1. GAS와 AT&T 문법
GAS는 GNU Assembler로서 GCC와 함께 쌍으로 사용되는 어셈블러이다. (인텔용 리눅스에는 GAS - /usr/bin/as - 외에도 AS86 - /usr/bin/as86 - 이라는 어셈블러가 있다. 이것은 x86용 16-bit 어셈블러로서, 여기서 사용하는 문법은 AT&T 문법이 아니라 Intel/Microsoft 형태에 가까운 것이다. 이 어셈블러는 커널의 boot loader같이 x86의 실제모드(real mode)에서 수행되는 16-bit 어셈블리 코드를 어셈블링하는데 사용한다. 이에 반해 GAS는 x86에만 국한되지 않는 32-bit 어셈블러이다.) GAS는 32-bit UNIX Compiler를 위해 만들어졌으므로, UNIX에서 일반적으로 사용되는 AT&T 문법을 따른다. 이 문법은 Intel/Microsoft에서 사용하는 문법과는 많이 다르다. 이를 비교해보면 :

* Register 이름 : 모든 레지스터 이름에는 %가 앞에 붙는다. 이는 레지스터와 다른 심볼들을 혼동하지 않게 하는 장점이 있다. 예를 들어 eax 레지스터를 나타낼 때 :

AT&T : %eax
Intel : eax

참고로 Intel 80386에는 다음과 같은 레지스터가 있다 :

o 일반 목적 register :
%eax (%ax, %ah, %al), %ebx (%bx, %bh, %bl), %ecx (%cx, %ch, %cl), %edx (%dx, %dh, %dl) : 32-bit, 16-bit, 8-bit로 사용가능
%esi (%si), %edi (%di), %ebp (%bp), %esp (%sp) : 32-bit, 16-bit로 사용가능
o segment (selector) register : %cs, %ds, %es, %fs, %gs, %ss
o flag register : (EFLAGS)
o instruction pointer : %eip
o processor control register : %cr0 - %cr4
o debug register : %db0 - %db7
o test register : %tr1 - %tr12
o floating point register stack : %st => %st(0) - %st(7)

* Operand 순서 : 원본(source)이 왼쪽, 목적지(destination)가 오른쪽에 위치한다. Intel 문법에서는 이와 반대로 되어 있다. 예를 들어 eax에서 ebx 레지스터로 데이터를 복사하는 것은 :

AT&T : movl %eax, %ebx
Intel : mov ebx, eax

* Operand 크기지정 : operand의 크기를 지정할 때 크기에 따라 b (byte), w (word), l (long) 접미사를 명령어에 붙인다. operand로 지정된 레지스터를 가지고 크기를 판단할 수 있을 때는 이를 생략할 수 있으며, 판단할 수 없는 경우 32-bit 연산으로 가정하게 된다. operand가 레지스터가 아니라 메모리인 경우는 반드시 접미사를 붙여야 한다. Intel에서는 byte ptr, word ptr, dword ptr 같은 지시자(specifier)를 사용하여 이를 나타낸다. 예를 들어 word크기의 foo 값을 bx로 복사하는 것은 :

AT&T : movw foo, %ax
Intel : mov ax, word ptr foo

이와 관련하여 AT&T와 Intel에서 사용하는 명령어들은 대부분 비슷하지만 몇가지 다른게 있다. sign extend 명령어와 zero extend 명령어는 조금 다른데, AT&T 문법에서는 extend 명령어에 원래의 크기와 확장할 크기를 지정하게 한다 :

movsSD (sign extend, Intel에서는 movsx)
movzSD (zero extend, Intel에서는 movzx)

여기서 S는 원래의 크기이고, D는 목적하는 크기이다. 예를 들어 ax를 ecx로 sign extend를 한다면 :

AT&T : movswl %ax, %ecx
Intel : movsx ecx, ax

또한 다음 변환함수에도 차이가 있다 :

cbtw (sign extend byte (%al) to word (%ax), Intel에서는 cbw)
cwtl (sign extend word (%ax) to long (%eax), Intel에서는 cwde)
cwtd (sign extend word (%ax) to long (%dx:%ax), Intel에서는 cwd)
cltd (sign extend dword (%eax) to quad (%edx:%eax), Intel에서는 cdq)

* 상수(constant)와 immediate 값 : 모든 상수와 immediate 값에는 $가 붙는다. 예를 들어 숫자 5는 $5라고 한다. 변수의 주소를 나타낼 때에도 앞에 $를 붙인다. 예를 들어 foo란 변수의 주소는 $foo이다. 그냥 foo라고 하면 변수의 값을 나타내게 된다. 숫자 0xd00d를 eax 레지스터로 복사하는 것은 :

AT&T : movl $0xd00d, %eax
Intel : mov eax, 0d000h

foo 변수의 주소를 eax 레지스터로 복사하는 것은 :

AT&T : movl $foo, %eax
Intel : mov eax, foo

foo의 값을 eax 레지스터로 복사하는 것은 :

AT&T : movl foo, %eax
Intel : mov eax, [foo]

* 메모리 참조 : 메모리 주소를 참조할데에는(indexing, indirection) AT&T와 Intel에서 표기법상 약간의 차이가 있다. base 주소와 index, scale, immediate 값이 주어졌을 때 :

AT&T : section:immed32(base, index, scale)
Intel : section:[base + index * scale + immed32]

이는 base + index * scale + immed32 주소를 나타내게 된다. 이들 모두를 반드시 지정해야 하는 것은 아니지만 immed32나 base 중의 하나는 반드시 지정해야 하며, 없는 항목은 비워두어도 된다. 주소 지정의 예로, eax 레지스터가 가리키는 주소의 값을 참조하는 경우 :

AT&T : (%eax)
Intel : [eax]

eax 레지스터에 변수(var)의 옵셋을 합한 주소를 참조하는 경우 :

AT&T : var(%eax)
Intel : [eax + var]

4바이트 단위로 된 정수 배열(int array[])의 eax번째 값을 참조하는 경우 (int array[eax]) :

AT&T : array(, %eax, 4)
Intel : [eax * 4 + array]

위 배열에서 ebx 인덱스에서 시작하여 eax번째 값을 참조하는 경우 (int array[ebx + eax]) :

AT&T : array(%ebx, %eax, 4)
Intel : [ebx + eax * 4 + array]

* jump/call/return : long jump나 long call에서는 다음과 같은 차이가 있다 :

AT&T : ljmp/lcall $section, $offset
Intel : jmp/call far section:offset

far retrun의 경우 :

AT&T : lret $stack-adjust
Intel : ret far stack-adjust

* 그밖에 : AT&T Assembler에서는 여러개의 section을 지원하지 않는다. UNIX 프로그램에서는 모든 프로그램이 하나의 section에 있다고 생각을 한다.


2. Inline Assembly
inline assembly는 high-level 언어로 된 코드 중간에 넣어서 사용하는 어셈블리 코드로, GCC에서 사용하는 inline assembly는 __asm__()안에 들어가며, 네가지 항목으로 이루어져 다음과 같은 형식으로 사용한다.

__asm__(어셈블리 문장 : 출력 : 입력 : 변경된 레지스터);

각 항목은 콜론(':')으로 구분되며, 어셈블리 문장은 반드시 들어가야 하지만, 뒤의 세 항목은 필요에 따라서 넣거나 생략할 수 있다. 각 항목은 다음과 같은 의미를 가진다.

* 어셈블리 문장 (assembly statement) : AT&T 형식으로 만들어진 어셈블리 코드로 "" 안에 넣어서 작성하며 각각의 줄은 newline으로 구분된다.
* 출력 (output) : 어셈블리 코드에서 출력용으로 사용하는 레지스터/메모리를 변수와 연결시켜준다. 여러개를 지정할 수 있으며 각 항목은 쉼표(',')로 구분된다. 각 항목은 "=g"(var)같은 형식을 가진다.
* 입력 (input) : 어셈블리 코드에서 입력으로 사용하는 레지스터/메모리를 변수와 연결시켜준다. 여러개를 지정할 수 있으며 각 항목은 쉼표(',')로 구분된다. 각 항목은 "g"(var)같은 형식을 가진다.
* 변경된 레지스터 (registers-modified 또는 clobbered regisers) : 어셈블리 코드에서 컴파일러가 모르는 사이에 바뀔 수 있는 레지스터의 목록을 기술한다. 각 항목은 "" 안에 들어가며, 여러개의 항목을 넣을 때에는 쉼표(',')로 구분한다. 메모리에 있는 변수의 값을 수정하는 경우 "memory"라고 기술해주어야 한다.

예제 코드를 보면 :

__asm__ ("pushl %eax\n"
"movl $1, %eax\n "
"popl %eax"
);

이 코드는 eax 레지스터를 저장하고 여기에 1을 입력했다가 eax 레지스터를 원래의 값으로 복구하는 코드이다. 여기서는 아무런 입력이나 출력이 없으며, 변경되는 레지스터도 없으므로 어셈블리 코드만 존재한다. 이제 i라는 변수를 하나 증가시키는 코드를 만들어보자.

int i = 0;

__asm__ ("pushl %%eax\n"
"movl %0, %%eax\n"
"addl $1, %%eax\n"
"movl %%eax, %0\n"
"popl %%eax"
: /* no output variable */
: "g" (i)
);

우선 이 코드에서 모든 레지스터 앞에 %가 두개가 붙어있는데, 입력이나 출력, 변경된 레지스터 중의 하나라도 기술을 하는 경우, 레지스터 이름에는 %를 하나가 아니라 두개를 붙여야 한다. 이는 내부에서 입출력을 나타내는데 %0, %1 같은 기호를 사용하는데, 이것과 혼동되는 것을 막기 위해서이다. 이 코드에서는 출력이 없으므로 출력은 비워 두었다. 입력에는 "g"(i)라고 적혀 있는데, 이는 i라는 변수를 %0과 연결시켜주는 역할을 한다. 즉 코드내에서 %0은 변수 i와 같은 의미로 사용된다. 따옴표 안에 있는 것은 변수와 어떤것이 연결되는지를 말하는데 g는 이경우 컴파일러가 알아서 레지스터에 넣던지 메모리에 두던지 하라고 지시하는 것이다. 따옴표 안에는 다음과 같은 것을 지정할 수 있으며, 그 의미는 다음과 같다.

a eax
b ebx
c ecx
d edx
S esi
D edi
I 상수 (0에서 31) ("I"라고 사용하는게 아니라 "0" 처럼 숫자를 넣어서 사용)
q eax, ebx, ecx, edx 중 동적으로 할당된 레지스터
r eax, ebx, ecx, edx, esi, edi 중 동적으로 할당된 레지스터
g eax, ebx, ecx, edx 또는 메모리에 있는 변수. 컴파일러가 선택
A eax 와 edx를 결합한 64-bit 정수
m 정적 메모리 위치
f floating point register

입력에서 여러개를 기술하면, 기술한 순서대로 차례로 %0, %1, ... 의 이름을 갖게 된다. 출력에도 무언가 기술한 경우, 출력부터 시작하여 차례로 %0, %1 ... 의 이름을 갖는다. 출력이 있는 예로 :

int x = 1, x_times_5;

__asm__ ("leal (%1, %1, 4), %0"
: "=r" (x_times_5)
: "r" (x)
);

위 코드는 x라는 변수를 다섯배 곱하여 x_times_5에 저장하는 것이다. (%1, %1, 4) = %1 + %1 * 4 = %1 * 5, lea는 주소를 저장하라는 명령이므로 %0에 %1을 다섯배한 값이 들어가게 된다. 여기서는 결과를 저장해야 하므로 출력에 "=r"(x_times_5)라고 출력되는 변수를 지정하였다. 따옴표안에 =가 들어가는 것은 출력임을 나타내기 위해서이다. 이 코드를 조금 수정하여 x를 다섯배 곱하여 자기 자신인 x에 이 값을 넣는다면 :

__asm__ ("leal (%1,%1,4), %0"
: "=r" (x)
: "0" (x)
);

여기서 입력에 "0"이라고 숫자로 썼는데, 이는 앞에서 지시한 것을 다시 가리키는 경우로, 여기서는 %0과 똑같은 것이라는 것을 말한다. 순서에 따라 출력 "=r"은 %0, 입력 "0"은 %1이 되는데, 자기 자신에게 결과를 돌려주어야 하므로, 이 둘이 같은 것이라는 것을 나타내기 위해 %1은 "0"이라고 하여 %0과 같은 것이라고 지시해주는 것이다. 그래서 이 코드는 x를 다섯배를 곱하여 결과를 자기 자신에서 돌려주게 된다. 다음은 입출력을 같이 하는 예로 k = i + j를 한다면 :

int i = 1, j = 2, k;

__asm__ __volatile__ ("pushl %%eax\n"
"movl %1, %%eax\n"
"addl %2, %%eax\n"
"movl %%eax, %0\n"
"popl %%eax"
: "=g" (k)
: "g" (i), "g" (j)
);

순서에 따라 k = %0, i = %1, j = %2가 되고, %1 + %2를 %0에 저장하므로 k에는 i + j 값이 들어가게 된다. 여기서 __asm__ 다음에 __volatile__이라는 지시자가 있는데, 이는 이 코드를 지정한 위치에 그대로 두라는 것이다. 컴파일러는 최적화(optimization)를 하는 과정에서 코드의 위치를 옮길 수 있는데 이를 막는 것이다.

#define rep_movsl(src, dest, numwords) \
__asm__ __volatile__ ( \
"cld\n" \
"rep\n" \
"movsl" \
: \
: "S" (src), "D" (dest), "c" (numwords) \
: "%ecx", "%esi", "%edi" \
)

위 코드는 src에서 dest로 지정한 길이만큼 복사하는 것이다 (C의 memcpy() 함수). 이 코드를 실행하면 ecx, esi, edi 레지스터가 바뀌므로, 마지막에 변경된 레지스터 목록에 이 세개를 지정해주었다.

#define rep_stosl(value, dest, numwords) \
__asm__ __volatile__ ( \
"cld\n" \
"rep\n" \
"stosl" \
: \
: "a" (value), "D" (dest), "c" (numwords) \
: "%ecx", "%edi" \
)

위 코드는 이전 코드와 비슷한 예로 dest의 지정한 길이만큼을 지정한 value로 설정하는 것이다 (C의 memset() 함수). inline assembly 안에서 local label도 사용할 수 있는데, 지정하는 방법은 일반 label과 똑같이 하지만, 이를 참조할 때에는 label이 앞에 있느냐, 뒤에 있느냐에 따라 b (backward), f (forward) 접미사를 붙여준다.

__asm__ ("" \
"0:\n" \
"jmp 1f\n" \ # jump to label 1: forward
"1:\n"\
"jmp 0b" \ # jump to label 0: backward
);


A. Reference

* Linux Assembly HOWTO :
o 영문판 : http://linuxdoc.org/HOWTO/Assembly-HOWTO.html
o 한글판 : http://kldp.org/HOWTO/Assembly-HOWTO
* Brennen's Guide to Inline Assembly :
o http://www.delorie.com/djgpp/doc/brennan/brennan_att_inline_djgpp.html
* DJGPP QuickASM Programming Guide :
o http://www.castle.net/~avly/djasm.html
* x86 Assembly Language FAQ :
o http://www.faqs.org/faqs/assembly-language/x86/
* GCC Manual (GCC Inline Assembly) :
o http://gcc.gnu.org/onlinedocs/gcc_toc.html
* GAS Manual :
o http://www.gnu.org/manual/gas-2.9.1/as.html

댓글 없음:

댓글 쓰기