HOME …＞プログラム講座 …＞ 8086アセンブラ入門

8086アセンブラ入門

「アセンブラ」と「コンパイラ」

アセンブラ言語とコンパイラ言語は、一見同じようなものに見えます。実際に、『プログラムを作る』という目的は同じです。しかし、中身はまったく違います。コンパイラは、その文法を解釈し機械語コードを生成するのに対し、アセンブラは単純に命令を１６進数に変換するだけです。（もちろん、それは『基本的には』であり、実際には疑似命令やラベルなどの処理は行いますが）。例えば、

PUSH BP
MOV BP,SP
PUSHF

→
→
→

５５
8B EC
9C

みたいに変換します。

コンピューターが理解できる言葉は、この『55 8B EC 9C』という数値（１６進数）だけです。コンピューターは、この１６進数を命令として受け取り、プログラムを実行するわけです。８ビットコンピューターの頃は、この１６進数（機械語ともいう）を、直接人間がコード表（ニーモニック）を見ながら打ち込んだり（ハンドアセンブル）したものですが、さすがにデバッグ効率も悪く、作るだけでも大変な手間になってしまいます。

そこで、この『55』を『PUSH BP』とか、『9C』を『PUSHF』という風に、人間が少しでもわかる言葉に直したものが、アセンブラ言語です。コンパイラとアセンブラの決定的な違いはここにあります。

	コンパイラ	アセンブラ
人間が入力するもの	文法に定められた言語、ラベル、ポイントタ	１６進数つけられた名前（ニーモニック）　ラベル、アドレス
機械語（１６進数）への変換	文法を解釈して生成する	１６進数につけられた名前をそのまま変換する

アドレス

アセンブラを学習する上で避けて通れないのが「アドレス」と「レジスタ」です。特に、アドレスという概念はアセンブラ以外ではほとんど意識する事はないでしょう。（Ｃ言語では、ポインタという形で若干意識する必要はありますが。）アドレスとは、簡単にいえば、メモリに割り付けられた住所の事です。

図のように、メモリには住所（アドレス）がつけられていて、メモリのデーターを読み書きする際にはこのアドレスを指定するようになっています。たとえば、0000H番地にFFHを書き込むきに、MOV [0000H],BYTE PTR 0FFHという風にします。

※『H』は、『１６進数』を示します。

　セグメント

８０８６系のＣＰＵでは、メモリを「セグメント」という形で分割して扱います。

たとえば、図のように4000Hをコードセグメント、8000Hをデーターセグメント、A000Hをエキストラセグメントに設定します。すると、コードセグメント上の１番地（CS:00001Hと表記する）は、

4000H
+ 0001H
40001H

というふうに、40001Hの事を指している事になります。このように、８０８６では物理アドレスを、セグメント：オフセットという形で扱います。８０８６では、セグメントを設定する際に、『セグメントレジスタ』を使います。

セグメント	レジスタ	用途
コードセグメント	ＣＳ	プログラム本体
データーセグメント	ＤＳ	データー（ワークエリアなど）
エキストラセグメント	ＥＳ	データー（Ｖ－ＲＡＭ、バッファなど）
スタックセグメント	ＳＳ	スタック

このように、８０８６ＣＰＵでは、00000H～0FFFFFHまでの、１ＭＢの空間を、それぞれ「セグメント」とよばれる６４ＫＢのエリアに分割しながら扱えるように設計されています。ちなみに、これは１６ビットＣＰＵ主流の頃の話であり、今では３２ビット（やそれ以上）のＣＰＵである、８０３８６、４８６、ペンティアム、ペンティアムII……等が使われているのですが、ＭＳ－ＤＯＳのような１６ビットＣＰＵ用に設計されたＯＳでは、３２ビットＣＰＵを「仮想８６モード」という、８０８６として動作するモードで動かします。

ここでは８０８６ＣＰＵを使う、もしくは、仮想８６モードを使うものとして話をすすめていきましょう。

プログラムで、メモリにアクセスする場合、『MOV AX,DS:[0001H]』みたいに記述します。しかし、単なるMOVE命令では省略すると自動的にデーターセグメントを使う事になっているため、データーセグメントにアクセスする時は、『MOV AX,[0001H]』と、『ＤＳ：』を省略して書きます。（省略した際に使われるセグメントは、命令によって異なります。）

レジスタ

レジスターというと、お店にある会計をする機械の事を思い浮かべる人が多いと思います。しかし、ここではレジスタとはＣＰＵがメモリを読み書きするために使うものをいいます。レジスタは、一部（Ｃ言語）で使う以外、コンパイラ言語ではほとんど出てきません。しかし、アセンブラではレジスタを使わずにプログラムを作る事はできません。ここでは、そのレジスタの働きを説明します。

ＣＰＵがメモリを書き換える際に使うのが、レジスタです。レジスタとは簡単にいうと『数値を一時的にとっておくための手』と思ってください。たとえば、人間が物を移動させる場合、通常は『手』に物を持ち、それを移動先に置きます。これと同じようなことをＣＰＵが行うわけです。

たとえば、データーセグメント内の、00001H番地の内容を、00004H番地内に移動させる場合を考えます。MOVSBという命令もあるのですが、ここでは説明のためにあえてMOV命令で記述すると、
MOV AL,[00001H]
MOV [00004H],AL
となります。これは、「ALレジスタに１番地の内容を入れろ」「4番地にALレジスタの内容を書け」という意味になります。

８０８６ＣＰＵでは、レジスタは以下のものがあります。

レジスタ		長さ		用途	レジスタ	長さ	用途
AX	AH	８ビット	１６ビット	計算。メモリの書き換え。	CS	１６ビット	コードセグメントを示す。
AX	AL	８ビット	１６ビット	計算。メモリの書き換え。	DS	１６ビット	データーセグメントを示す。
BX	BH	８ビット	１６ビット	計算。ソースインデックスのベースアドレス。	ES	１６ビット	エキストラセグメントを示す。
BX	BL	８ビット	１６ビット	計算。ソースインデックスのベースアドレス。	SS	１６ビット	スタックセグメントを示す。
CX	CH	８ビット	１６ビット	カウンター。	Ｆ	１６ビット	フラグ
CX	CL	８ビット	１６ビット	カウンター。	IP	１６ビット	今実行中のプログラムの場所
DX	DH	８ビット	１６ビット	ＡＸレジスタと組み合わせた３２ビット長の計算。
DX	DL	８ビット	１６ビット	ＡＸレジスタと組み合わせた３２ビット長の計算。
SI		１６ビット		ソースインデックス。（アドレス格納）
DI		１６ビット		ディスティネーションインデックス。（アドレス格納）
BP		１６ビット		ポインタのベースアドレス。
SP		１６ビット		スタックポインタ

モトローラ系の68000系などは、レジスタごとに役割が決まってない（それぞれ汎用で使える）のですが、８０８６ＣＰＵではレジスタごとに役割分担がはっきりしているようです。もちろん、上記用途以外でも使えないことはないのですが、ＳＩのオフセット値としてＢＸレジスタやＢＰレジスタは使えて、ＡＸレジスタはつかえないとか、ループやシフト命令を使う時にはＣＸレジスタが使われるなど、用途別に使い分けた方がなにかと都合が良いように設計されています。

ラベル

これまでの説明では、アドレスは直接番地を指定してきましたが、実際には番地を直接書くのはまれで、「ラベル」というものを使います。たとえば、

ERRFLG
ABFLG
EOFFLG
HFLG
KFLG

DB 0
DB 0
DB 0
DB 0
DB 0

このように、メモリに名前を付けます。実際にどの番地に割り当てられるかは、コンパイル時に決まります。（どのセグメントにロードされるかは、プログラムがメモリにロードされた時に決まります。）以後は、メモリの書き換えはアドレスを意識する事なく、このラベルを使って指定する事ができます。

例）

MOV AL,[ERRFLG]

表記

８０８６系のアセンブラでは、表記にいくつかの決まりごとがあります。中には他の言語と大きく異なる点もあります。

大文字小文字

アセンブラでは（特に指定しない限り、デフォルトでは）大文字と小文字は区別しません。つまり、label_1とLABEL_1は同じ意味になります。また、ニーモニックの記述は大文字でも小文字でもかまいません。なので、全て大文字で記述する人もいれば、全て小文字で記述する人などまちまちです。

私のような８ビットマシンのＢＡＳＩＣ＋アセンブラからこの世界に入った人は、アセンブラの記述も全て大文字で書いてしまうのですが、最初にＣ系の言語(C、C++、PHP、Perl）から入った人は小文字で記述する人が多いようです。

１６進数

１６進数を表記するためには、うしろにＨをつけます。10Hは、１０進数では１６になります。

ただし先頭にＡ～Ｆまでの文字が来る場合、ラベルなのか１６進数なのか区別ができなくなるため、１６進数である事を明記するために、先頭に０（ゼロ）を補います。たとえば、FFHだけだとラベルなのか１６進数なのか区別がつかないため、１６進数なら0FFHとします。（ちなみに、０がないとＦＦＨというラベルとして扱われます。）

２進数

アセンブラでは、フラグを操作する時など、よく２進数を扱います。２進数は後ろにＢをつけます。たとえば、00100Bは、１０進数で４になります。

１０進数

１０進数は、そのまま表記すれば１０進数になります。しかし、１０進数である事を明確にする時は、うしろにＤをつけます。

アドレス

アドレス参照なのか、即値なのかを区別するために、［］（カギカッコ）を使います。たとえば、MOV AX,1とすると、ＡＸレジスタに「１」が入り、MOV AX,[1]とすると、メモリの１番地に書いてある内容がＡＸレジスタに入ります。

バイト・ワード

８０８６アセンブラでは、１バイトを「バイト」、２バイトを「ワード」と呼びます。ＡＸレジスタなど、１６ビット単位で数値を扱う場合は「ワード単位で扱う」と呼びます。

転送

メモリからレジスタに数値を入れたり、メモリにレジスタの中身を書き出したりする場合に、ＭＯＶを使います。

MOV レジスタ,メモリ	メモリ→レジスタに転送します。
MOV メモリ,レジスタ	レジスタ→メモリに転送します。
MOV レジスタ１,レジスタ２	レジスタ２→レジスタ１に転送します。
MOV メモリ,即値	メモリに即値を転送します。

転送の方向は、ＣＯＢＯＬとは違い、右から左になることに注意してください。（MOV AX,1は、「１」→「ＡＸ」と転送される）。レジスタに１６ビット長のレジスタを指定した場合、自動的にメモリは１６ビット単位（ワード）で転送されます。ただし、即値をメモリに入れる時は、バイト単位なのかワード単位なのかわかりません。そこで、コンパイラに、バイトかワードかをかを指示します。これは、「BYTE PTR」および「WORD PTR」と表記します。

例）

MOV [AFLG],BYTE PTR 1

メモリ[AFLG]に、「１」を、バイト単位で転送する。

演算

演算命令には、ADD、SUB、MUL、DIVなどがあります。

命令	書式	意味
ADD	ADD レジスタ,即値	レジスタに即値の値を足します。
	ADD メモリ,即値	メモリに即値の値を足します。（WORD PTR かBYTE PTRの指定が必要）
	ADD レジスタ１,レジスタ２	レジスタ１とレジスタ２を足して、レジスタ１に入れます。
ADC	ADDと同じように機能しますが、さらにキャリーフラグの値も足します。
SUB	SUB レジスタ,即値	レジスタから、即値の値を引きます。
	SUB メモリ,即値	メモリから即値の値を引きます。（WORD PTR かBYTE PTRの指定が必要）
	SUB レジスタ１,レジスタ２	レジスタ１からレジスタ２を引いて、結果をレジスタ１に入れます。
SBB	SUBと同じように機能しますが、さらにキャリーフラグも引きます。
MUL	MUL ８ビットレジスタ	指定レジスタとＡＬレジスタをかけて、結果をＡＸレジスタに入れる。
	MUL １６ビットレジスタ	指定レジスタとＡＸレジスタをかけて、結果をＤＸ：ＡＸレジスタに入れる。
	MUL BYTE PTR メモリ	指定メモリの値とＡＬレジスタをかけて、結果をＡＸレジスタに入れる。
	MUL WORD PTR メモリ	指定メモリの値とＡＸレジスタをかけて、結果をＤＸ：ＡＸレジスタに入れる。
IMUL	MULを符号付きで行う。
DIV	DIV ８ビットレジスタ	ＡＸレジスタから指定レジスタを割って、商をALあまりをAHレジスタに入れる。
	DIV １６ビットレジスタ	ＤＸ：ＡＸレジスタから指定レジスタを割って、商をAXあまりをDXレジスタに入れる。
	DIV BYTE PTR メモリ	ＡＸレジスタから指定メモリを割って、商をALあまりをAHレジスタに入れる。
	DIV WORD PTR メモリ	ＤＸ：ＡＸレジスタから指定メモリを割って、商をAXあまりをDXレジスタに入れる。
IDIV	DIVを符号付きで行う。

ここで注意するのは、『わり算』です。ゼロで割ったり、商がALレジスタ（あるいはAXレジスタ）に収まりきれない場合は、INT 0が発生します。ＭＳ－ＤＯＳでは「０で除算しました」というエラーメッセージを発してプログラムを終了します。ＤＯＳプロンプトの時は、『このプログラムは不正な処理を行ったので強制終了します』と出ます。

コンパイラやインタプリタ言語では、大抵の場合ＣＰＵが０で割るような事がないように事前にチェックをし、Division by zeroなどのエラーを出力するようになっていますが、アセンブラで０で割ってしまうともうプログラムでエラー処理をかます事ができなくなるため、通常は割る前に０で除算してないかどうか、また、商がオーバーフローしないかどうかをチェックする必要があります。

もし、１６ビット以上の足し算をしたい場合はどうすればいいのでしょう。その場合、ADCを使います。まず下位バイト同士を足した後、ADC命令を使って上位バイト同士を足します。すると、下位バイトで発生した桁上がり（キャリーフラグ）が足されるため、３２ビット（やそれ以上）の足し算が可能になります。

ビットシフト演算

１０進数で１を１桁あげると１０となり１０倍になります。８進数で001を１桁繰り上げると010(=8)となり８倍になります。のように、ｎ進数では、１桁くりあげるとｎ倍になります。なので、２進数では１桁くりあげると２倍になります。ビットシフト演算は、レジスタまたはメモリのビットをシフトして、二進数の桁のくり上げや、くり下げなどを行います。

たとえば、二進数０００００００１を１つ左にシフトしてみます。

のように、結果は『２』になり、『２倍』になりました。

左シフトを繰り返すと、２、４、８、１６、３２、６４、１２８、２５６、という風に、どんどん２倍になってゆきます。このように、単純に２倍、もしくは１／２倍にしたい場合、時間のかかるMULやDIVを用いることなく、ビットシフト命令で代用できます。

左シフト	右シフト	意味	使用例
SHL	SHR	ビットをシフトし、はみ出た分はキャリーフラグにセットされる。	SHL AX,1 ＡＸレジスタを左に１回シフトする。 SHR AX,CL AXレジスタを右に、CLレジスタ分だけシフトする。 ※シフト量は、１または、ＣＬが指定できる。
SAL	SAR	ビットをシフトし、はみ出た分はキャリーフラグにセットされる。右シフトの時は最上位ビットは保存され、２番目のビットにコピーされる。
ROL	ROR	ビットをシフトし、はみ出た分は、最上位（または最下位）ビットに移動する。
RCL	RCR	ビットをキャリーフラグを含んでシフトする。

ここで、もし、ＤＸ：ＡＸレジスタを左シフトしたい場合は、SHL AX,1でＡＸレジスタを左シフトした後、RCL DX,1でキャリーフラグを含んでシフトします。

論理演算

論理演算は、主にビットを操作する時に使います。

ＡＮＤ
両方のビットが１のとき、１、どちらかが０の時０になります。つまり、特定のビットだけを調べたい時に使います。

例）

	01010101
AND）	10000000
	00000000

最上位ビット以外は必ず０になるため、他のビットに関係なく最上位ビットが０かどうかを調べることができる。

ＯＲ
どちらかのビットが１なら１になります。特定のビットを１にする時に使います。

例）

	01010101
OR）	10000000
	11010101

最上位ビットは必ず１になるため、他のビットをそのままにして、最上位ビットを１にしたいときに使う。

ＸＯＲ
両方のビットが同じなら０、異なっていたら１になります。

例）

	01010101
ＸＯＲ）	01010101
	00000000

両方のビットが全部同じなため、０になります。自分自身とＸＯＲを取ることで、０にする事ができます。

NOT
ビットを反転させます。

例）

ＮＯＴ）	01010101
	10101010

ビットが反転され、１が０に、０が１になります。

NEG
符号を反転させます。具体的には、ビットを反転させた後、＋１します。

例）

ＮＥＧ）	00000001
	11111111

１の符号を反転させ、－１（つまり、FF）にします。

論理演算は主にＩ／Ｏポートを操作する時などで、特定のビットをたてたり、おろしたりする時に使います。

分岐

構造化プログラミングでは、分岐命令はとかく嫌われ者ですが、アセンブラでは分岐命令なしにプログラムを組むのは不可能です。とくに、条件判断はすべて分岐命令ですので、分岐命令なしでは条件判断すらできない事になります。

ＪＭＰ
指定されたアドレスに分岐します。分岐には相対分岐と絶対分岐があります。とはいえ、６８０９のように命令が違うわけではなく、両方ともＪＭＰ命令を使います。ただ、オペランドにレジスタやメモリが指定されたときは絶対分岐、即値が指定された時は相対分岐になります。

ＪＭＰ　即値	即値（もしくはラベル）で示された場所に相対分岐する。
ＪＭＰ　レジスタ	レジスタのアドレスに絶対分岐する。
ＪＭＰ　WORD PTR[メモリ]	メモリで示された場所に書いてあるアドレスに分岐する。
ＪＭＰ　DWORD PTR[メモリ]	メモリで示された場所（オフセット：セグメント）に分岐する。

相対分岐とは、「今そのプログラムが実行されている場所から、どれだけ離れたところに分岐するか」という値で分岐します。アセンブラでは、分岐先のラベルを指定する事で、自動的に計算してくれるので、その辺を気にする必要はないです。

ここで、１バイトで表現できる場所への分岐（－１２８～＋１２７バイト以内）なら、分岐先を１バイトで表します。また、２バイトで表現できる場所への分岐は、分岐先を２バイトで表します。

ただし、分岐先が、今そのプログラムが実行されている場所（ＩＰ）より後ろで、＋１２７バイト以内の分岐だった場合、ＮＯＰが挿入され、命令全体が３バイトにそろえられます。なぜならば、今のアドレスより手前のアドレスは既にアドレスが確定されているから良いのですが、今のアドレスより後ろのアドレスは、今実行中の命令（この場合ＪＭＰ）の長さが変わると、アドレスも当然かわってしまうので、計算ができなくなってしまうからです。

このことは、次の条件分岐を使う場合に影響します。

条件分岐
フラグの状態により分岐します。

符号なし	符号付き	意味
JA、JNBE	JG、JNLE	大きい、同じか小さくない
JAE、JNB	JGE、JNL	同じか大きい、小さくない
JE、JZ	JE、JZ	同じ、ゼロ
JBE、JNA	JLE、JNG	同じか小さい、大きくない
JB、JNAE	JL、JNGE	小さい、同じか大きくない
JNE、JNZ	JNE、JNZ	同じじゃない、ゼロじゃない

分岐命令は同じ命令にも２通りの書き方がありますが、生成されるコードは同じです。

条件分岐命令に続いて分岐先をアドレス（ラベル）で指定します。条件が成立していれば、指定のアドレス（ラベル）に分岐します。（条件が成立しなければ、何もせず符号なしの条件判断では、上（Above）、下（Below）の頭文字を取って、「JA」とか「JB」とかいう表現が使われます。

うち消す場合は、NotのNを用いて、「JNA」とか「JNB」とか書きます。『または同じ』という場合は、同じ（Equal）のEをとって、JAEとか、JBEとか書きます。符号付きの場合は、大きい（Great）と小さい（Low）の頭文字をとって、JGとか、JLとかいう風に書きます。符号なしの場合、『大きい』か『小さい』かの判断はキャリーフラグを使います。直前の命令、SUBもしくはCMPを使って、キャリーフラグを変化させます。

例）

CMP AX,1
JA HANDAN1

AXと１を比較して、大きければHANDAN1へ分岐する。

この場合、CMPとは『非破壊検査』といって、AXレジスタから１を引いたものとして（実際には引かない）、ＡＸの方が小さければキャリーフラグをセットします。また、AXと1が同じならば、ゼロフラグをセットします。同様に、符号ありの場合、サインフラグとオーバーフローフラグを使って判断します。

ここで問題なのは『条件分岐には、ショートジャンプしかない』という点です。６８０９のような、LBRAとかＬＢＳＲみたいにロング分岐命令なんてものはありませんし、JSRみたいに絶対分岐命令もありません。じゃあ、飛び先が－１２８～＋１２７だった場合どうするか、という問題にぶつかります。この場合、

解決法１：ジャンプテーブルを作る

例）
CMP AX,1
JB TBL1
JMP TBL2

TBL1: JMP 飛び先Ａ
TBL2: JMP 飛び先Ｂ

＋１２７バイト以内に、『飛び先へ飛ぶための飛び先』があって、そこへ条件分岐させる方法です。この方法は思いつきやすい反面、ややこしいのが欠点です。なにしろ、飛び先のラベルの他に、飛び先へいくためのラベルまで必要になります。

解決法２：判断を逆転させる

CMP AX,1
JA $+5
JMP TBL1

つまり、「大きければ分岐」は、「同じか小さければ分岐しない」という風に、また「同じならば分岐」は「違えば分岐しない」という風に、考え方を逆転させて考えます。この場合、「同じか小さければ分岐」したいので、「大きければ分岐命令を飛ばす」というふうに書きます。この方法もかなりややこしいのですが、ジャンプテーブル方式よりもリストがすっきりします。

ただし、注意してください。$+5は、『今実行中の命令よりも５バイト後』という意味ですが、それに続くＪＭＰ命令が、そこのアドレスよりも手前への分岐だった場合、ＪＭＰ命令が２バイトになってしまう事があるからです。

この場合、次の命令の飛び先の距離によって$+4にしたり、$+5にしたりするのでは、微妙な距離の場合に困ってしまうので、次の分岐命令はできるだけ下のアドレスへの分岐に統一します。やむをえず手前に分岐するときは、とりあえず$+5としておき、次に必ずNOPを１つ入れるという手もありますが、素直にラベルを記述した方が良いでしょう。

IN、OUT

IN、OUTは、Ｉ／Ｏポートを読み書きする命令です。これができる事が、アセンブラプログラムの最大の利点といえます。

Ｃ言語でも多少はできるますが、やはりＩ／Ｏポートを直接制御するような部分には、インラインアセンブルなどでアセンブラ言語で記述してある事が多いようです。Ｉ／Ｏポートとは、コンピューターに接続（または内蔵）された機器に対して情報をやりとりするための『窓口』だと思ってください。

コンピューターと機器はこのようにＩ／Ｏポートを通して情報をやりとりします。（ちなみに、ポートは『港』の意味です）

実際に、どのポートを、どう操作すれば、どの機械が制御できるかは、パソコンによって決まっています。互換性を持たせるためには、Ｉ／Ｏポートの場所や制御方法は同じにしておく必要があります。（したがって、ＡＴ互換機同士は、Ｉ／Ｏポートは互換性があります）

たとえば、ディスプレイコントローラーに「プレーン２のＶ－ＲＡＭの情報を用意しろ」という命令（厳密にはちょっと違うが）を送るには、

MOV AL,02H
MOV DX,3C4H
OUT DX,AL
MOV AL,2
MOV DX,3C5H
OUT DX,AL

みたいにして、03C4H、03C5Hという２つのＩ／Ｏポートに数値を出力します。同様に、Ｖ－ＲＡＭのオフセットレジスタの値を読むためには、ＩＮ命令を用いて

MOV AL,13H
MOV DX,03D4H
OUT DX,AL
MOV DX,03D5H
IN AL,DX

みたいにして書きます。

どのＩ／Ｏポートを、どう操作すれば、何がおこるかは、その目的のパソコンの詳細資料が必要になります。つまり、アセンブラでプログラムを作るためには、アセンブラの記述方法を知っている事はもちろん、目的のパソコンの資料をできる限り集めなくてはならないという事になります。アセンブラでグラフィックスの描写ルーチンを作っていた頃の私の部屋は、Ｊ－３１００やＰＣ－９８０１、ＡＴ互換機の資料でいっぱいでした。

また、Ｉ／Ｏポートを操作する場合、同じ互換機同士、たとえばＰＣ／ＡＴ互換機同士でもＣＰＵ速度によってウェイトのタイミングがうまくいかなかったり、その機種独自のクセのようなものがあったりして、互換性を損ねてしまう（いわゆる『相性の関係で動かないというやつ』）ので、できる限り避けます。

私も、Ｉ／Ｏポートを操作するのは、どうしても速度を上げたい場合（つまり、画面制御でＶ－ＲＡＭを直接書き換えるプログラム）にとどめています。プリンターの制御など、さほど処理速度を要求しない場合はＢＩＯＳを使うようにします。

ソフトウェア割り込み

ソフトウェア割り込みに関する命令は、以下のような種類があります。

命令	意味
INT 割り込み番号	割り込み番号で示した割り込み処理へ分岐する。
IRET	割り込み処理から抜ける。
STI	割り込み処理を許可する。
CLI	割り込み処理を禁止する。

INTは主にＢＩＯＳやＤＯＳ割り込みを呼び出すために使います。

例）プリンターに、スペース量補正コマンドを送る

MOV AH,0
MOV AL,1CH
MOV DX,0
INT 17H
MOV AH,0
MOV AL,55H
MOV DX,0
INT 17H

この場合、INT 17Hという「プリンターＢＩＯＳ」を呼びしました。また、

例）ファイルをリードモードでオープンする

MOV AH,3DH
MOV AL,00010010B
MOV DX,OFFSET SFILE
INT 21H

この場合、ファイルをオープンするという、ＭＳ－ＤＯＳ割り込みを呼びました。

ＭＳ－ＤＯＳ割り込みとは、INT 21Hを使った割り込みの事で、ＭＳ－ＤＯＳが用意した『基本プログラム』です。これは、ＭＳ－ＤＯＳ搭載マシン全体で互換性があります。（もっとも、バージョンによって違いはありますが）。したがって、ＭＳ－ＤＯＳ割り込みだけを使ってプログラムを作れば、「ＭＳ－ＤＯＳ互換」というプログラムが作れる事になります。

ＢＩＯＳとは、そのパソコンに用意された『基本プログラム』です。たとえば、プリンターに１バイト出力したり、キーボードから１文字入力したりという、汎用的なプログラムは、あらかじめ機械の方で用意されています。これを使うことにより、機械同士のクセやウェイトのタイミングなどの『相性の問題』を吸収してくれます。

これらの基本プログラムは、ソフトウェア割り込みを使って呼び出します。どのソフトウェア割り込みをつかうと、何が起こるかは、ＭＳ－ＤＯＳ割り込みやＢＩＯＳ割り込みに関する情報を記した資料が必要になります。Ｉ／Ｏポートの制御と同様、資料を集める必要があります。

とにかく、アセンブラ使いは、資料を集めなくてはいけないという事です。アセンブラでプログラムを作る場合にしても、互換性のためになるべく以下のようにします。

なるべくＭＳ－ＤＯＳ割り込みだけで作る
ＭＳ－ＤＯＳ割り込みだけでできない部分だけは、ＢＩＯＳを使う。
ＤＯＳ割り込みでもＢＩＯＳでもできない場合、Ｉ／Ｏポートを「しかたなく」操作する。

ＭＳ－ＤＯＳ割り込みやＢＩＯＳ割り込みについては、プログラム講座とはまた別の話になりますので、 OOh!Dyna や、 OOh!PC をご覧ください。

サブルーチンとスタック

頻繁に使うルーチンを『サブルーチン』にして、メインルーチンから呼びます。サブルーチンを呼ぶためには、CALLを使います。

CALL ラベル	ラベルの場所にサブルーチンコールする。
CALL [ラベル]	ラベルの場所に書いてあるアドレスにサブルーチンコールする。
CALL DWORD PTR [ラベル]	ラベルの書いてあるアドレス（オフセット：セグメント）にサブルーチンコールする。
RET	サブルーチンから戻る（NEARアドレス）
RETF	サブルーチンから戻る（ＦＡＲアドレス）

ＣＡＬＬ命令がくると、プログラムはサブルーチンに制御を移します。具体的には、サブルーチンから戻る番地をスタックに保存した後、サブルーチンへ制御がうつる（ＩＰがサブルーチンのアドレスにセットされる）わけです。

また、RETがくると、サブルーチンから復帰します。具体的には、スタックのアドレスをＩＰに戻し、スタックをポップします。ここで、スタックとは、「データーを一時的に保存しておく場所」という事です。

スタックは、スタックセグメント内に確保され、上のアドレスからどんどん下のアドレスに向かって使用されます。

スタックは、最後に入れた値から順に取り出されます。（ラストＩＮ・ファーストＯＵＴ）。

スタックの用途は、レジスタの保存や、ＣＡＬＬ時の戻り番地の保存に使われます。また、Ｃ言語ではローカル変数の保存に使ったり、関数通しのパラメーターの受け渡しにも使います。（Ｃだけでなく、ＣＯＢＯＬでも、アセンブラルーチンへのパラメーターの受け渡しに使われます）

スタックにデーターを入れることを「ＰＵＳＨする」といいます。また、スタックからデーターを取り出す事を「ＰＯＰする」といいます。スタックは、最後にＰＵＳＨしたものが、ＰＯＰすると出てきます。つまり、

PUSH BP
PUSHF
PUSH AX
PUSH BX

としてレジスタを保存した場合、取り出す時は

POP BX
POP AX
POPF
POP BP

という風に、ＰＵＳＨした時とは逆順にＰＯＰしなければなりません。（この順番をわざと変えて、レジスタの内容を交換するという事もできます）

レジスタにＰＵＳＨしたデーターは、必ずＰＯＰしなければなりません。でないと、そのプログラムが１回実行するたびにスタックポインタが手前に下がってしまい、しまいには重要なデーターを壊す（スタックアウトする）場合があるからです。また、ＰＵＳＨ、ＰＯＰの数が合ってないと、サブルーチンからも復帰できなくなります。

しかし、どうしてもスタックを一気に破棄したいという場合は、ADD SP,+2のように、スタックポインタを増やしてしまうという方法もあります。この場合、そのルーチンを通る時点でスタックがどれぐらい詰まれているかを正しく把握する必要があります。条件によってスタックのつまれる量が違ったりすると思わぬバグの元になります。

ストリング命令

ストリング命令は、単純な命令を繰り返し実行する事ができます。また、LOOP命令を使ってループを作るよりも実行速度ははるかに高速になります。Ｖ－ＲＡＭを同じ値で一気に塗りつぶす時とか、別の場所にコピーする場合とかに有効です。

STOS
ALレジスタか、AXレジスタの内容を、DS:[SI]で示すアドレスに書き出します。

STOSB	ALレジスタをES:[DI]に書き出す。
STOSW	AXレジスタをES:[DI]に書き出す。

これをリピート命令と組み合わせて使うことによって、連続したアドレスに対して行う事ができます。

例）
MOV AX,0
MOV CX,10
CLD
REP STOSW

ＡＸレジスタの内容（ここでは０）を、ES:[DI]で示すアドレスに書いて、DIレジスタを＋２する。これを、ＣＸで示した数（１０回）実行する。

ここで、ＣＸレジスタは繰り返す回数を指定します。ES:[DI]レジスタは１回実行するたびに＋２します。なお、ＣＬＤのかわりにSTDが指定さえた場合、１回実行するごとに、DIレジスタを－２します。（アドレスの若い方に向かって繰り返します）。

MOVS
DS:[SI]レジスタで示したアドレスから、ES:[DI]レジスタで示したアドレスへ、メモリを転送する。

MOVSB	DS:[SI]レジスタで示したアドレスから、ES:[DI]レジスタで示したアドレスへ、メモリを転送する。転送は１バイトごとに行われる。
MOVSW	DS:[SI]レジスタで示したアドレスから、ES:[DI]レジスタで示したアドレスへ、メモリを転送する。転送は２バイトごとに行われる。

ここで、MOVSWは２バイト単位で転送が行われるので、MOVSBより高速になります。なお、MOVSBではALレジスタが、MOBSWではAXレジスタが転送の際に使用され、最後に転送した値がAX（AL）レジスタに残ります。

SCAS
ALレジスタ（もしくは、ＡＸレジスタ）の値と、ES:[DI]レジスタで示された場所の値を比較します。これは、REPEもしくは、REPNE命令と共に使います。

例）

MOV AX,0
MOV CX,10
CLD
REPNE SCASW

AXレジスタの値（ここでは０）と、ES:[DI]の値と比較する。同じものがあるまで、ＣＸレジスタの数（１０回）まで繰り返す。

CMPS
DS:[SI]とES:[DI]の値を比較します。

例）

MOV CX,10
CLD
REPNE CMPSW

DS:[SI]と、ES:[DI]の値と比較する。同じものがあるまで、ＣＸレジスタの数（１０回）まで繰り返す。

SCAS、CMPSともに、１バイト単位なら、SCASB、CMPSB、２バイト単位ならSCASW、CMPSWと書きます。また、REPEと書くと「同じ限り繰り返す」となり、REPNEと書くと「違う限り繰り返す」という意味になります。

その他

あまり使わない命令ですが、知っておくと何かと便利な命令です。

LEA
アドレスをレジスタにセットします。たとえば、LEA BX,[SI]と書くと、SIレジスタの示すアドレスにある値ではなく、SIレジスタの値そのものがBXレジスタに入ります。また、LEA DI,[SI+BX]と書くと、DIレジスタには、SI+BXの結果そのものが入ります。

LDS
DSレジスタと、指定レジスタに値を同時にロードします。たとえば、LDS SI,[TBL1]とすると、TBL1で示した場所にある値（オフセット：セグメント）が、DSレジスタとSIレジスタにロードされます。他に、LESという命令がありますが、これは、DSのかわりにESにロードされます。

XLAT
「ＢＸレジスタ＋ＡＬレジスタ」で示されたアドレスの値を、ＡＬレジスタにセットします。たとえば、ＢＸレジスタにバッファの先頭アドレスをセットしておいて、そこから、＋ＡＬの所にあるデーターを取り出したい時に使います。

MS-DOSに戻る

シングルタスクであるMS-DOS上でアセンブラでプログラムを作る場合、最後にはＭＳ－ＤＯＳに制御を戻します。Linuxでは無限ループにしておいて常にバックグラウンドで動作させておいて、不要になったらKILL -KILLコマンドでメモリから削除するという手もあるのですが、MS-DOSは基本的にシングルタスクなので、プログラムが終了したらMS-DOSに戻さないと、そのプログラムのせいでコンピューターをリセットせざるを得なくなります。(WindowsのDOS窓なら話は別ですが）

MOV AH,4CH
INT 21H

AHレジスタに4CHをいれておき、INT 21HのDOSコールをする事で、プログラムは終了し、DOSの制御に戻ります。

最後に

以上で、アセンブラの命令はほとんど説明し終わりました。アセンブラは命令数自体は非常に少なく、また、それらをすべて使わなくても、プログラムを作ることはできます。しかし、逆にいえば、これだけでは、何も作ることはできません。つまり、アセンブラでプログラムを作るためには、「どこのメモリを、どう書き換えると、何が起こるか」「どの割り込みを、どう呼べば、どうなるか」「どのＩ／Ｏポートを書き換えると、どうなるか」を調べなくてはなりません。

アセンブラでプログラムを作る場合は、まずその機械の資料を集めてみましょう。逆に目的のハードウェアの仕様書さえあれば、アセンブラ使いにとって鬼に金棒です。

このページの先頭へ