gas2ack
- an asmconv based tool for conversion from GNU ia32 assembly to ACK assembly - in contrast to asmconv it is a one way tool only - as the GNU assembly in Minix does not prefix global C symbols with _ gas2ack detects such symbols and prefixes them to be compliant with the ACK convention - gas2ack preserves comments and unexpanded macros - bunch of fixes to the asmconv GNU->ACK direction - support of more instructions that ACK does not know but are in use in Minix - it is meant as a temporary solution as long as ACK will be a supported compiler for the core system
This commit is contained in:
parent
6c4197f77e
commit
41d481b065
13 changed files with 2852 additions and 0 deletions
|
@ -28,3 +28,4 @@ clean::
|
||||||
|
|
||||||
all install clean::
|
all install clean::
|
||||||
cd asmconv && $(MAKE) $@
|
cd asmconv && $(MAKE) $@
|
||||||
|
cd gas2ack && $(MAKE) $@
|
||||||
|
|
29
commands/i386/gas2ack/Makefile
Normal file
29
commands/i386/gas2ack/Makefile
Normal file
|
@ -0,0 +1,29 @@
|
||||||
|
# Makefile for gas2ack.
|
||||||
|
|
||||||
|
CFLAGS= $(OPT)
|
||||||
|
LDFLAGS= -i
|
||||||
|
CC = exec cc
|
||||||
|
|
||||||
|
all: gas2ack
|
||||||
|
|
||||||
|
OBJ= asm86.o gas2ack.o globals.o parse_gnu.o \
|
||||||
|
tokenize.o emit_ack.o
|
||||||
|
|
||||||
|
gas2ack: $(OBJ)
|
||||||
|
$(CC) $(LDFLAGS) -o $@ $(OBJ)
|
||||||
|
|
||||||
|
install: /usr/bin/gas2ack
|
||||||
|
|
||||||
|
/usr/bin/gas2ack: gas2ack
|
||||||
|
install -cs -o bin gas2ack $@
|
||||||
|
|
||||||
|
clean:
|
||||||
|
rm -f $(OBJ) gas2ack core
|
||||||
|
|
||||||
|
# Dependencies.
|
||||||
|
asm86.o: asm86.h asmconv.h token.h
|
||||||
|
gas2ack.o: asmconv.h languages.h asm86.h
|
||||||
|
globals.o: asm86.h
|
||||||
|
parse_gnu.o: asmconv.h languages.h token.h asm86.h
|
||||||
|
tokenize.o: asmconv.h token.h
|
||||||
|
emit_ack.o: asmconv.h languages.h token.h asm86.h
|
87
commands/i386/gas2ack/asm86.c
Normal file
87
commands/i386/gas2ack/asm86.c
Normal file
|
@ -0,0 +1,87 @@
|
||||||
|
/* asm86.c - 80X86 assembly intermediate Author: Kees J. Bot
|
||||||
|
* 24 Dec 1993
|
||||||
|
*/
|
||||||
|
#define nil 0
|
||||||
|
#include <stddef.h>
|
||||||
|
#include <string.h>
|
||||||
|
#include <assert.h>
|
||||||
|
#include "asm86.h"
|
||||||
|
#include "asmconv.h"
|
||||||
|
#include "token.h"
|
||||||
|
|
||||||
|
expression_t *new_expr(void)
|
||||||
|
/* Make a new cell to build an expression. */
|
||||||
|
{
|
||||||
|
expression_t *e;
|
||||||
|
|
||||||
|
e= allocate(nil, sizeof(*e));
|
||||||
|
e->operator= -1;
|
||||||
|
e->left= e->middle= e->right= nil;
|
||||||
|
e->name= nil;
|
||||||
|
e->magic= 31624;
|
||||||
|
return e;
|
||||||
|
}
|
||||||
|
|
||||||
|
void del_expr(expression_t *e)
|
||||||
|
/* Delete an expression tree. */
|
||||||
|
{
|
||||||
|
if (e != nil) {
|
||||||
|
assert(e->magic == 31624);
|
||||||
|
e->magic= 0;
|
||||||
|
deallocate(e->name);
|
||||||
|
del_expr(e->left);
|
||||||
|
del_expr(e->middle);
|
||||||
|
del_expr(e->right);
|
||||||
|
deallocate(e);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
asm86_t *new_asm86(void)
|
||||||
|
/* Make a new cell to hold an 80X86 instruction. */
|
||||||
|
{
|
||||||
|
asm86_t *a;
|
||||||
|
|
||||||
|
a= allocate(nil, sizeof(*a));
|
||||||
|
a->opcode= -1;
|
||||||
|
get_file(&a->file, &a->line);
|
||||||
|
a->optype= NONE;
|
||||||
|
a->oaz= 0;
|
||||||
|
a->rep= ONCE;
|
||||||
|
a->seg= DEFSEG;
|
||||||
|
a->args= nil;
|
||||||
|
a->magic= 37937;
|
||||||
|
a->raw_string = NULL;
|
||||||
|
return a;
|
||||||
|
}
|
||||||
|
|
||||||
|
void del_asm86(asm86_t *a)
|
||||||
|
/* Delete an 80X86 instruction. */
|
||||||
|
{
|
||||||
|
assert(a != nil);
|
||||||
|
assert(a->magic == 37937);
|
||||||
|
a->magic= 0;
|
||||||
|
del_expr(a->args);
|
||||||
|
deallocate(a->raw_string);
|
||||||
|
a->raw_string = NULL;
|
||||||
|
deallocate(a);
|
||||||
|
}
|
||||||
|
|
||||||
|
int isregister(const char *name)
|
||||||
|
/* True if the string is a register name. Return its size. */
|
||||||
|
{
|
||||||
|
static char *regs[] = {
|
||||||
|
"al", "bl", "cl", "dl", "ah", "bh", "ch", "dh",
|
||||||
|
"ax", "bx", "cx", "dx", "si", "di", "bp", "sp",
|
||||||
|
"eax", "ebx", "ecx", "edx", "esi", "edi", "ebp", "esp",
|
||||||
|
"cs", "ds", "es", "fs", "gs", "ss",
|
||||||
|
"cr0", "cr1", "cr2", "cr3", "cr4",
|
||||||
|
"st",
|
||||||
|
};
|
||||||
|
int reg;
|
||||||
|
|
||||||
|
for (reg= 0; reg < arraysize(regs); reg++) {
|
||||||
|
if (strcmp(name, regs[reg]) == 0)
|
||||||
|
return reg+1;
|
||||||
|
}
|
||||||
|
return 0;
|
||||||
|
}
|
272
commands/i386/gas2ack/asm86.h
Normal file
272
commands/i386/gas2ack/asm86.h
Normal file
|
@ -0,0 +1,272 @@
|
||||||
|
/* asm86.h - 80X86 assembly intermediate Author: Kees J. Bot
|
||||||
|
* 27 Jun 1993
|
||||||
|
*/
|
||||||
|
|
||||||
|
typedef enum opcode { /* 80486 opcodes, from the i486 reference manual.
|
||||||
|
* Synonyms left out, some new words invented.
|
||||||
|
*/
|
||||||
|
DOT_ALIGN,
|
||||||
|
DOT_ASCII, DOT_ASCIZ,
|
||||||
|
DOT_ASSERT, /* Pseudo's invented */
|
||||||
|
DOT_BASE,
|
||||||
|
DOT_COMM, DOT_LCOMM,
|
||||||
|
DOT_DATA1,
|
||||||
|
DOT_DATA2,
|
||||||
|
DOT_DATA4,
|
||||||
|
DOT_DEFINE, DOT_EXTERN,
|
||||||
|
DOT_EQU,
|
||||||
|
DOT_FILE, DOT_LINE,
|
||||||
|
DOT_LABEL,
|
||||||
|
DOT_LIST, DOT_NOLIST,
|
||||||
|
DOT_SPACE,
|
||||||
|
DOT_SYMB,
|
||||||
|
DOT_TEXT, DOT_ROM, DOT_DATA, DOT_BSS, DOT_END,
|
||||||
|
DOT_USE16, DOT_USE32,
|
||||||
|
AAA,
|
||||||
|
AAD,
|
||||||
|
AAM,
|
||||||
|
AAS,
|
||||||
|
ADC,
|
||||||
|
ADD,
|
||||||
|
AND,
|
||||||
|
ARPL,
|
||||||
|
BOUND,
|
||||||
|
BSF,
|
||||||
|
BSR,
|
||||||
|
BSWAP,
|
||||||
|
BT,
|
||||||
|
BTC,
|
||||||
|
BTR,
|
||||||
|
BTS,
|
||||||
|
CALL, CALLF, /* CALLF added */
|
||||||
|
CBW,
|
||||||
|
CLC,
|
||||||
|
CLD,
|
||||||
|
CLI,
|
||||||
|
CLTS,
|
||||||
|
CMC,
|
||||||
|
CMP,
|
||||||
|
CMPS,
|
||||||
|
CMPXCHG,
|
||||||
|
CPUID,
|
||||||
|
CWD,
|
||||||
|
DAA,
|
||||||
|
DAS,
|
||||||
|
DEC,
|
||||||
|
DIV,
|
||||||
|
ENTER,
|
||||||
|
F2XM1,
|
||||||
|
FABS,
|
||||||
|
FADD, FADDD, FADDS, FADDP, FIADDL, FIADDS,
|
||||||
|
FBLD,
|
||||||
|
FBSTP,
|
||||||
|
FCHS,
|
||||||
|
FCLEX,
|
||||||
|
FCOMD, FCOMS, FCOMPD, FCOMPS, FCOMPP,
|
||||||
|
FCOS,
|
||||||
|
FDECSTP,
|
||||||
|
FDIVD, FDIVS, FDIVP, FIDIVL, FIDIVS,
|
||||||
|
FDIVRD, FDIVRS, FDIVRP, FIDIVRL, FIDIVRS,
|
||||||
|
FFREE,
|
||||||
|
FICOM, FICOMP,
|
||||||
|
FILDQ, FILDL, FILDS,
|
||||||
|
FINCSTP,
|
||||||
|
FINIT,
|
||||||
|
FISTL, FISTS, FISTP,
|
||||||
|
FLDX, FLDD, FLDS,
|
||||||
|
FLD1, FLDL2T, FLDL2E, FLDPI, FLDLG2, FLDLN2, FLDZ,
|
||||||
|
FLDCW,
|
||||||
|
FLDENV,
|
||||||
|
FMULD, FMULS, FMULP, FIMULL, FIMULS,
|
||||||
|
FNOP,
|
||||||
|
FPATAN,
|
||||||
|
FPREM,
|
||||||
|
FPREM1,
|
||||||
|
FPTAN,
|
||||||
|
FRNDINT,
|
||||||
|
FRSTOR,
|
||||||
|
FSAVE,
|
||||||
|
FSCALE,
|
||||||
|
FSIN,
|
||||||
|
FSINCOS,
|
||||||
|
FSQRT,
|
||||||
|
FSTD, FSTS, FSTPX, FSTPD, FSTPS,
|
||||||
|
FSTCW,
|
||||||
|
FSTENV,
|
||||||
|
FSTSW,
|
||||||
|
FSUBD, FSUBS, FSUBP, FISUBL, FISUBS,
|
||||||
|
FSUBRD, FSUBRS, FSUBPR, FISUBRL, FISUBRS,
|
||||||
|
FTST,
|
||||||
|
FUCOM, FUCOMP, FUCOMPP,
|
||||||
|
FXAM,
|
||||||
|
FXCH,
|
||||||
|
FXTRACT,
|
||||||
|
FYL2X,
|
||||||
|
FYL2XP1,
|
||||||
|
HLT,
|
||||||
|
IDIV,
|
||||||
|
IMUL,
|
||||||
|
IN,
|
||||||
|
INC,
|
||||||
|
INS,
|
||||||
|
INT, INTO,
|
||||||
|
INVD,
|
||||||
|
INVLPG,
|
||||||
|
IRET, IRETD,
|
||||||
|
JA, JAE, JB, JBE, JCXZ, JE, JG, JGE, JL,
|
||||||
|
JLE, JNE, JNO, JNP, JNS, JO, JP, JS,
|
||||||
|
JMP, JMPF, /* JMPF added */
|
||||||
|
LAHF,
|
||||||
|
LAR,
|
||||||
|
LEA,
|
||||||
|
LEAVE,
|
||||||
|
LGDT, LIDT,
|
||||||
|
LGS, LSS, LDS, LES, LFS,
|
||||||
|
LLDT,
|
||||||
|
LMSW,
|
||||||
|
LOCK,
|
||||||
|
LODS,
|
||||||
|
LOOP, LOOPE, LOOPNE,
|
||||||
|
LSL,
|
||||||
|
LTR,
|
||||||
|
MOV,
|
||||||
|
MOVS,
|
||||||
|
MOVSX,
|
||||||
|
MOVSXB,
|
||||||
|
MOVZX,
|
||||||
|
MOVZXB,
|
||||||
|
MUL,
|
||||||
|
NEG,
|
||||||
|
NOP,
|
||||||
|
NOT,
|
||||||
|
OR,
|
||||||
|
OUT,
|
||||||
|
OUTS,
|
||||||
|
POP,
|
||||||
|
POPA,
|
||||||
|
POPAD,
|
||||||
|
POPF,
|
||||||
|
PUSH,
|
||||||
|
PUSHA,
|
||||||
|
PUSHAD,
|
||||||
|
PUSHF,
|
||||||
|
RCL, RCR, ROL, ROR,
|
||||||
|
RET, RETF, /* RETF added */
|
||||||
|
SAHF,
|
||||||
|
SAL, SAR, SHL, SHR,
|
||||||
|
SBB,
|
||||||
|
SCAS,
|
||||||
|
SETA, SETAE, SETB, SETBE, SETE, SETG, SETGE, SETL,
|
||||||
|
SETLE, SETNE, SETNO, SETNP, SETNS, SETO, SETP, SETS,
|
||||||
|
SGDT, SIDT,
|
||||||
|
SHLD,
|
||||||
|
SHRD,
|
||||||
|
SLDT,
|
||||||
|
SMSW,
|
||||||
|
STC,
|
||||||
|
STD,
|
||||||
|
STI,
|
||||||
|
STOS,
|
||||||
|
STR,
|
||||||
|
SUB,
|
||||||
|
TEST,
|
||||||
|
VERR, VERW,
|
||||||
|
WAIT,
|
||||||
|
WBINVD,
|
||||||
|
XADD,
|
||||||
|
XCHG,
|
||||||
|
XLAT,
|
||||||
|
XOR,
|
||||||
|
COMMENT,
|
||||||
|
C_PREPROCESSOR,
|
||||||
|
UNKNOWN
|
||||||
|
} opcode_t;
|
||||||
|
|
||||||
|
#define is_pseudo(o) ((o) <= DOT_USE32)
|
||||||
|
#define N_OPCODES ((int) XOR + 1)
|
||||||
|
|
||||||
|
#define OPZ 0x01 /* Operand size prefix. */
|
||||||
|
#define ADZ 0x02 /* Address size prefix. */
|
||||||
|
|
||||||
|
typedef enum optype {
|
||||||
|
NONE, PSEUDO, JUMP, JUMP16, BYTE, WORD, OWORD /* Ordered list! */
|
||||||
|
} optype_t;
|
||||||
|
|
||||||
|
typedef enum repeat {
|
||||||
|
ONCE, REP, REPE, REPNE
|
||||||
|
} repeat_t;
|
||||||
|
|
||||||
|
typedef enum segment {
|
||||||
|
DEFSEG, CSEG, DSEG, ESEG, FSEG, GSEG, SSEG
|
||||||
|
} segment_t;
|
||||||
|
|
||||||
|
typedef struct expression {
|
||||||
|
int operator;
|
||||||
|
struct expression *left, *middle, *right;
|
||||||
|
char *name;
|
||||||
|
size_t len;
|
||||||
|
unsigned magic;
|
||||||
|
} expression_t;
|
||||||
|
|
||||||
|
typedef struct asm86 {
|
||||||
|
opcode_t opcode; /* DOT_TEXT, MOV, ... */
|
||||||
|
char *file; /* Name of the file it is found in. */
|
||||||
|
long line; /* Line number. */
|
||||||
|
optype_t optype; /* Type of operands: byte, word... */
|
||||||
|
int oaz; /* Operand/address size prefix? */
|
||||||
|
repeat_t rep; /* Repeat prefix used on this instr. */
|
||||||
|
segment_t seg; /* Segment override. */
|
||||||
|
expression_t *args; /* Arguments in ACK order. */
|
||||||
|
unsigned magic;
|
||||||
|
char * raw_string; /* each instruction can have a comment.
|
||||||
|
Instruction can be empty if the
|
||||||
|
comment is the only thing on the
|
||||||
|
line. Or the instruction can be a
|
||||||
|
preprocessor macro. It may span
|
||||||
|
multiple lines and does not contain
|
||||||
|
any instruction
|
||||||
|
*/
|
||||||
|
} asm86_t;
|
||||||
|
|
||||||
|
expression_t *new_expr(void);
|
||||||
|
void del_expr(expression_t *a);
|
||||||
|
asm86_t *new_asm86(void);
|
||||||
|
void del_asm86(asm86_t *a);
|
||||||
|
|
||||||
|
int isregister(const char *name);
|
||||||
|
|
||||||
|
#define IS_REG8(n) ((n) >= 1 && (n) <=8)
|
||||||
|
#define IS_REG16(n) ((n) >= 9 && (n) <=16)
|
||||||
|
#define IS_REG32(n) ((n) >= 17 && (n) <=24)
|
||||||
|
#define IS_REGSEG(n) ((n) >= 25 && (n) <=30)
|
||||||
|
#define IS_REGCR(n) ((n) >= 31 && (n) <=35)
|
||||||
|
#define segreg2seg(reg) ((segment_t)(reg - 25 + 1))
|
||||||
|
|
||||||
|
/*
|
||||||
|
* Format of the arguments of the asm86_t structure:
|
||||||
|
*
|
||||||
|
*
|
||||||
|
* ACK assembly operands expression_t cell:
|
||||||
|
* or part of operand: {operator, left, middle, right, name, len}
|
||||||
|
*
|
||||||
|
* [expr] {'[', nil, expr, nil}
|
||||||
|
* word {'W', nil, nil, nil, word}
|
||||||
|
* "string" {'S', nil, nil, nil, "string", strlen("string")}
|
||||||
|
* label = expr {'=', nil, expr, nil, label}
|
||||||
|
* expr * expr {'*', expr, nil, expr}
|
||||||
|
* - expr {'-', nil, expr, nil}
|
||||||
|
* (memory) {'(', nil, memory, nil}
|
||||||
|
* offset(base)(index*n) {'O', offset, base, index*n}
|
||||||
|
* base {'B', nil, nil, nil, base}
|
||||||
|
* index*4 {'4', nil, nil, nil, index}
|
||||||
|
* operand, oplist {',', operand, nil, oplist}
|
||||||
|
* label : {':', nil, nil, nil, label}
|
||||||
|
*
|
||||||
|
* The precedence of operators is ignored. The expression is simply copied
|
||||||
|
* as is, including parentheses. Problems like missing operators in the
|
||||||
|
* target language will have to be handled by rewriting the source language.
|
||||||
|
* 16-bit or 32-bit registers must be used where they are required by the
|
||||||
|
* target assembler even though ACK makes no difference between 'ax' and
|
||||||
|
* 'eax'. Asmconv is smart enough to transform compiler output. Human made
|
||||||
|
* assembly can be fixed up to be transformable.
|
||||||
|
*/
|
24
commands/i386/gas2ack/asmconv.h
Normal file
24
commands/i386/gas2ack/asmconv.h
Normal file
|
@ -0,0 +1,24 @@
|
||||||
|
/* asmconv.h - shared functions Author: Kees J. Bot
|
||||||
|
* 19 Dec 1993
|
||||||
|
*/
|
||||||
|
|
||||||
|
#define arraysize(a) (sizeof(a)/sizeof((a)[0]))
|
||||||
|
#define arraylimit(a) ((a) + arraysize(a))
|
||||||
|
#define between(a, c, z) \
|
||||||
|
((unsigned)((c) - (a)) <= (unsigned)((z) - (a)))
|
||||||
|
|
||||||
|
void *allocate(void *mem, size_t size);
|
||||||
|
void deallocate(void *mem);
|
||||||
|
void fatal(char *label);
|
||||||
|
char *copystr(const char *s);
|
||||||
|
int isanumber(const char *s);
|
||||||
|
|
||||||
|
extern int asm_mode32; /* In 32 bit mode if true. */
|
||||||
|
|
||||||
|
#define use16() (!asm_mode32)
|
||||||
|
#define use32() ((int) asm_mode32)
|
||||||
|
#define set_use16() ((void) (asm_mode32= 0))
|
||||||
|
#define set_use32() ((void) (asm_mode32= 1))
|
||||||
|
|
||||||
|
extern int err_code; /* Exit code. */
|
||||||
|
#define set_error() ((void) (err_code= EXIT_FAILURE))
|
696
commands/i386/gas2ack/emit_ack.c
Normal file
696
commands/i386/gas2ack/emit_ack.c
Normal file
|
@ -0,0 +1,696 @@
|
||||||
|
/* emit_ack.c - emit ACK assembly Author: Kees J. Bot
|
||||||
|
* emit NCC assembly 27 Dec 1993
|
||||||
|
*/
|
||||||
|
#define nil 0
|
||||||
|
#include <stdio.h>
|
||||||
|
#include <stdlib.h>
|
||||||
|
#include <stdarg.h>
|
||||||
|
#include <string.h>
|
||||||
|
#include <assert.h>
|
||||||
|
#include "asmconv.h"
|
||||||
|
#include "token.h"
|
||||||
|
#include "asm86.h"
|
||||||
|
#include "languages.h"
|
||||||
|
#include "globals.h"
|
||||||
|
|
||||||
|
typedef struct mnemonic { /* ACK as86 mnemonics translation table. */
|
||||||
|
opcode_t opcode;
|
||||||
|
char *name;
|
||||||
|
} mnemonic_t;
|
||||||
|
|
||||||
|
static mnemonic_t mnemtab[] = {
|
||||||
|
{ AAA, "aaa" },
|
||||||
|
{ AAD, "aad" },
|
||||||
|
{ AAM, "aam" },
|
||||||
|
{ AAS, "aas" },
|
||||||
|
{ ADC, "adc%" },
|
||||||
|
{ ADD, "add%" },
|
||||||
|
{ AND, "and%" },
|
||||||
|
{ ARPL, "arpl" },
|
||||||
|
{ BOUND, "bound" },
|
||||||
|
{ BSF, "bsf" },
|
||||||
|
{ BSR, "bsr" },
|
||||||
|
{ BSWAP, "bswap" },
|
||||||
|
{ BT, "bt" },
|
||||||
|
{ BTC, "btc" },
|
||||||
|
{ BTR, "btr" },
|
||||||
|
{ BTS, "bts" },
|
||||||
|
{ CALL, "call" },
|
||||||
|
{ CALLF, "callf" },
|
||||||
|
{ CBW, "cbw" },
|
||||||
|
{ CLC, "clc" },
|
||||||
|
{ CLD, "cld" },
|
||||||
|
{ CLI, "cli" },
|
||||||
|
{ CLTS, "clts" },
|
||||||
|
{ CMC, "cmc" },
|
||||||
|
{ CMP, "cmp%" },
|
||||||
|
{ CMPS, "cmps%" },
|
||||||
|
{ CMPXCHG, "cmpxchg" },
|
||||||
|
{ CWD, "cwd" },
|
||||||
|
{ DAA, "daa" },
|
||||||
|
{ DAS, "das" },
|
||||||
|
{ DEC, "dec%" },
|
||||||
|
{ DIV, "div%" },
|
||||||
|
{ DOT_ALIGN, ".align" },
|
||||||
|
{ DOT_ASCII, ".ascii" },
|
||||||
|
{ DOT_ASCIZ, ".asciz" },
|
||||||
|
{ DOT_ASSERT, ".assert" },
|
||||||
|
{ DOT_BASE, ".base" },
|
||||||
|
{ DOT_BSS, ".sect .bss" },
|
||||||
|
{ DOT_COMM, ".comm" },
|
||||||
|
{ DOT_DATA, ".sect .data" },
|
||||||
|
{ DOT_DATA1, ".data1" },
|
||||||
|
{ DOT_DATA2, ".data2" },
|
||||||
|
{ DOT_DATA4, ".data4" },
|
||||||
|
{ DOT_DEFINE, ".define" },
|
||||||
|
{ DOT_END, ".sect .end" },
|
||||||
|
{ DOT_EXTERN, ".extern" },
|
||||||
|
{ DOT_FILE, ".file" },
|
||||||
|
{ DOT_LCOMM, ".comm" },
|
||||||
|
{ DOT_LINE, ".line" },
|
||||||
|
{ DOT_LIST, ".list" },
|
||||||
|
{ DOT_NOLIST, ".nolist" },
|
||||||
|
{ DOT_ROM, ".sect .rom" },
|
||||||
|
{ DOT_SPACE, ".space" },
|
||||||
|
{ DOT_SYMB, ".symb" },
|
||||||
|
{ DOT_TEXT, ".sect .text" },
|
||||||
|
{ DOT_USE16, ".use16" },
|
||||||
|
{ DOT_USE32, ".use32" },
|
||||||
|
{ ENTER, "enter" },
|
||||||
|
{ F2XM1, "f2xm1" },
|
||||||
|
{ FABS, "fabs" },
|
||||||
|
{ FADD, "fadd" },
|
||||||
|
{ FADDD, "faddd" },
|
||||||
|
{ FADDP, "faddp" },
|
||||||
|
{ FADDS, "fadds" },
|
||||||
|
{ FBLD, "fbld" },
|
||||||
|
{ FBSTP, "fbstp" },
|
||||||
|
{ FCHS, "fchs" },
|
||||||
|
{ FCLEX, "fclex" },
|
||||||
|
{ FCOMD, "fcomd" },
|
||||||
|
{ FCOMPD, "fcompd" },
|
||||||
|
{ FCOMPP, "fcompp" },
|
||||||
|
{ FCOMPS, "fcomps" },
|
||||||
|
{ FCOMS, "fcoms" },
|
||||||
|
{ FCOS, "fcos" },
|
||||||
|
{ FDECSTP, "fdecstp" },
|
||||||
|
{ FDIVD, "fdivd" },
|
||||||
|
{ FDIVP, "fdivp" },
|
||||||
|
{ FDIVRD, "fdivrd" },
|
||||||
|
{ FDIVRP, "fdivrp" },
|
||||||
|
{ FDIVRS, "fdivrs" },
|
||||||
|
{ FDIVS, "fdivs" },
|
||||||
|
{ FFREE, "ffree" },
|
||||||
|
{ FIADDL, "fiaddl" },
|
||||||
|
{ FIADDS, "fiadds" },
|
||||||
|
{ FICOM, "ficom" },
|
||||||
|
{ FICOMP, "ficomp" },
|
||||||
|
{ FIDIVL, "fidivl" },
|
||||||
|
{ FIDIVRL, "fidivrl" },
|
||||||
|
{ FIDIVRS, "fidivrs" },
|
||||||
|
{ FIDIVS, "fidivs" },
|
||||||
|
{ FILDL, "fildl" },
|
||||||
|
{ FILDQ, "fildq" },
|
||||||
|
{ FILDS, "filds" },
|
||||||
|
{ FIMULL, "fimull" },
|
||||||
|
{ FIMULS, "fimuls" },
|
||||||
|
{ FINCSTP, "fincstp" },
|
||||||
|
{ FINIT, "finit" },
|
||||||
|
{ FISTL, "fistl" },
|
||||||
|
{ FISTP, "fistp" },
|
||||||
|
{ FISTS, "fists" },
|
||||||
|
{ FISUBL, "fisubl" },
|
||||||
|
{ FISUBRL, "fisubrl" },
|
||||||
|
{ FISUBRS, "fisubrs" },
|
||||||
|
{ FISUBS, "fisubs" },
|
||||||
|
{ FLD1, "fld1" },
|
||||||
|
{ FLDCW, "fldcw" },
|
||||||
|
{ FLDD, "fldd" },
|
||||||
|
{ FLDENV, "fldenv" },
|
||||||
|
{ FLDL2E, "fldl2e" },
|
||||||
|
{ FLDL2T, "fldl2t" },
|
||||||
|
{ FLDLG2, "fldlg2" },
|
||||||
|
{ FLDLN2, "fldln2" },
|
||||||
|
{ FLDPI, "fldpi" },
|
||||||
|
{ FLDS, "flds" },
|
||||||
|
{ FLDX, "fldx" },
|
||||||
|
{ FLDZ, "fldz" },
|
||||||
|
{ FMULD, "fmuld" },
|
||||||
|
{ FMULP, "fmulp" },
|
||||||
|
{ FMULS, "fmuls" },
|
||||||
|
{ FNOP, "fnop" },
|
||||||
|
{ FPATAN, "fpatan" },
|
||||||
|
{ FPREM, "fprem" },
|
||||||
|
{ FPREM1, "fprem1" },
|
||||||
|
{ FPTAN, "fptan" },
|
||||||
|
{ FRNDINT, "frndint" },
|
||||||
|
{ FRSTOR, "frstor" },
|
||||||
|
{ FSAVE, "fsave" },
|
||||||
|
{ FSCALE, "fscale" },
|
||||||
|
{ FSIN, "fsin" },
|
||||||
|
{ FSINCOS, "fsincos" },
|
||||||
|
{ FSQRT, "fsqrt" },
|
||||||
|
{ FSTCW, "fstcw" },
|
||||||
|
{ FSTD, "fstd" },
|
||||||
|
{ FSTENV, "fstenv" },
|
||||||
|
{ FSTPD, "fstpd" },
|
||||||
|
{ FSTPS, "fstps" },
|
||||||
|
{ FSTPX, "fstpx" },
|
||||||
|
{ FSTS, "fsts" },
|
||||||
|
{ FSTSW, "fstsw" },
|
||||||
|
{ FSUBD, "fsubd" },
|
||||||
|
{ FSUBP, "fsubp" },
|
||||||
|
{ FSUBPR, "fsubpr" },
|
||||||
|
{ FSUBRD, "fsubrd" },
|
||||||
|
{ FSUBRS, "fsubrs" },
|
||||||
|
{ FSUBS, "fsubs" },
|
||||||
|
{ FTST, "ftst" },
|
||||||
|
{ FUCOM, "fucom" },
|
||||||
|
{ FUCOMP, "fucomp" },
|
||||||
|
{ FUCOMPP, "fucompp" },
|
||||||
|
{ FXAM, "fxam" },
|
||||||
|
{ FXCH, "fxch" },
|
||||||
|
{ FXTRACT, "fxtract" },
|
||||||
|
{ FYL2X, "fyl2x" },
|
||||||
|
{ FYL2XP1, "fyl2xp1" },
|
||||||
|
{ HLT, "hlt" },
|
||||||
|
{ IDIV, "idiv%" },
|
||||||
|
{ IMUL, "imul%" },
|
||||||
|
{ IN, "in%" },
|
||||||
|
{ INC, "inc%" },
|
||||||
|
{ INS, "ins%" },
|
||||||
|
{ INT, "int" },
|
||||||
|
{ INTO, "into" },
|
||||||
|
{ INVD, "invd" },
|
||||||
|
{ INVLPG, "invlpg" },
|
||||||
|
{ IRET, "iret" },
|
||||||
|
{ IRETD, "iretd" },
|
||||||
|
{ JA, "ja" },
|
||||||
|
{ JAE, "jae" },
|
||||||
|
{ JB, "jb" },
|
||||||
|
{ JBE, "jbe" },
|
||||||
|
{ JCXZ, "jcxz" },
|
||||||
|
{ JE, "je" },
|
||||||
|
{ JG, "jg" },
|
||||||
|
{ JGE, "jge" },
|
||||||
|
{ JL, "jl" },
|
||||||
|
{ JLE, "jle" },
|
||||||
|
{ JMP, "jmp" },
|
||||||
|
{ JMPF, "jmpf" },
|
||||||
|
{ JNE, "jne" },
|
||||||
|
{ JNO, "jno" },
|
||||||
|
{ JNP, "jnp" },
|
||||||
|
{ JNS, "jns" },
|
||||||
|
{ JO, "jo" },
|
||||||
|
{ JP, "jp" },
|
||||||
|
{ JS, "js" },
|
||||||
|
{ LAHF, "lahf" },
|
||||||
|
{ LAR, "lar" },
|
||||||
|
{ LDS, "lds" },
|
||||||
|
{ LEA, "lea" },
|
||||||
|
{ LEAVE, "leave" },
|
||||||
|
{ LES, "les" },
|
||||||
|
{ LFS, "lfs" },
|
||||||
|
{ LGDT, "lgdt" },
|
||||||
|
{ LGS, "lgs" },
|
||||||
|
{ LIDT, "lidt" },
|
||||||
|
{ LLDT, "lldt" },
|
||||||
|
{ LMSW, "lmsw" },
|
||||||
|
{ LOCK, "lock" },
|
||||||
|
{ LODS, "lods%" },
|
||||||
|
{ LOOP, "loop" },
|
||||||
|
{ LOOPE, "loope" },
|
||||||
|
{ LOOPNE, "loopne" },
|
||||||
|
{ LSL, "lsl" },
|
||||||
|
{ LSS, "lss" },
|
||||||
|
{ LTR, "ltr" },
|
||||||
|
{ MOV, "mov%" },
|
||||||
|
{ MOVS, "movs%" },
|
||||||
|
{ MOVSX, "movsx" },
|
||||||
|
{ MOVSXB, "movsxb" },
|
||||||
|
{ MOVZX, "movzx" },
|
||||||
|
{ MOVZXB, "movzxb" },
|
||||||
|
{ MUL, "mul%" },
|
||||||
|
{ NEG, "neg%" },
|
||||||
|
{ NOP, "nop" },
|
||||||
|
{ NOT, "not%" },
|
||||||
|
{ OR, "or%" },
|
||||||
|
{ OUT, "out%" },
|
||||||
|
{ OUTS, "outs%" },
|
||||||
|
{ POP, "pop" },
|
||||||
|
{ POPA, "popa" },
|
||||||
|
{ POPAD, "popad" },
|
||||||
|
{ POPF, "popf" },
|
||||||
|
{ PUSH, "push" },
|
||||||
|
{ PUSHA, "pusha" },
|
||||||
|
{ PUSHAD, "pushad" },
|
||||||
|
{ PUSHF, "pushf" },
|
||||||
|
{ RCL, "rcl%" },
|
||||||
|
{ RCR, "rcr%" },
|
||||||
|
{ RET, "ret" },
|
||||||
|
{ RETF, "retf" },
|
||||||
|
{ ROL, "rol%" },
|
||||||
|
{ ROR, "ror%" },
|
||||||
|
{ SAHF, "sahf" },
|
||||||
|
{ SAL, "sal%" },
|
||||||
|
{ SAR, "sar%" },
|
||||||
|
{ SBB, "sbb%" },
|
||||||
|
{ SCAS, "scas%" },
|
||||||
|
{ SETA, "seta" },
|
||||||
|
{ SETAE, "setae" },
|
||||||
|
{ SETB, "setb" },
|
||||||
|
{ SETBE, "setbe" },
|
||||||
|
{ SETE, "sete" },
|
||||||
|
{ SETG, "setg" },
|
||||||
|
{ SETGE, "setge" },
|
||||||
|
{ SETL, "setl" },
|
||||||
|
{ SETLE, "setle" },
|
||||||
|
{ SETNE, "setne" },
|
||||||
|
{ SETNO, "setno" },
|
||||||
|
{ SETNP, "setnp" },
|
||||||
|
{ SETNS, "setns" },
|
||||||
|
{ SETO, "seto" },
|
||||||
|
{ SETP, "setp" },
|
||||||
|
{ SETS, "sets" },
|
||||||
|
{ SGDT, "sgdt" },
|
||||||
|
{ SHL, "shl%" },
|
||||||
|
{ SHLD, "shld" },
|
||||||
|
{ SHR, "shr%" },
|
||||||
|
{ SHRD, "shrd" },
|
||||||
|
{ SIDT, "sidt" },
|
||||||
|
{ SLDT, "sldt" },
|
||||||
|
{ SMSW, "smsw" },
|
||||||
|
{ STC, "stc" },
|
||||||
|
{ STD, "std" },
|
||||||
|
{ STI, "sti" },
|
||||||
|
{ STOS, "stos%" },
|
||||||
|
{ STR, "str" },
|
||||||
|
{ SUB, "sub%" },
|
||||||
|
{ TEST, "test%" },
|
||||||
|
{ VERR, "verr" },
|
||||||
|
{ VERW, "verw" },
|
||||||
|
{ WAIT, "wait" },
|
||||||
|
{ WBINVD, "wbinvd" },
|
||||||
|
{ XADD, "xadd" },
|
||||||
|
{ XCHG, "xchg%" },
|
||||||
|
{ XLAT, "xlat" },
|
||||||
|
{ XOR, "xor%" },
|
||||||
|
};
|
||||||
|
|
||||||
|
#define farjmp(o) ((o) == JMPF || (o) == CALLF)
|
||||||
|
|
||||||
|
static FILE *ef;
|
||||||
|
static long eline= 1;
|
||||||
|
static char *efile;
|
||||||
|
static char *orig_efile;
|
||||||
|
static char *opcode2name_tab[N_OPCODES];
|
||||||
|
static enum dialect { ACK, NCC } dialect= ACK;
|
||||||
|
|
||||||
|
static void ack_putchar(int c)
|
||||||
|
/* LOOK, this programmer checks the return code of putc! What an idiot, noone
|
||||||
|
* does that!
|
||||||
|
*/
|
||||||
|
{
|
||||||
|
if (putc(c, ef) == EOF) fatal(orig_efile);
|
||||||
|
}
|
||||||
|
|
||||||
|
static void ack_printf(const char *fmt, ...)
|
||||||
|
{
|
||||||
|
va_list ap;
|
||||||
|
|
||||||
|
va_start(ap, fmt);
|
||||||
|
if (vfprintf(ef, fmt, ap) == EOF) fatal(orig_efile);
|
||||||
|
va_end(ap);
|
||||||
|
}
|
||||||
|
|
||||||
|
void ack_emit_init(char *file, const char *banner)
|
||||||
|
/* Prepare producing an ACK assembly file. */
|
||||||
|
{
|
||||||
|
mnemonic_t *mp;
|
||||||
|
|
||||||
|
if (file == nil) {
|
||||||
|
file= "stdout";
|
||||||
|
ef= stdout;
|
||||||
|
} else {
|
||||||
|
if ((ef= fopen(file, "w")) == nil) fatal(file);
|
||||||
|
}
|
||||||
|
orig_efile= file;
|
||||||
|
efile= file;
|
||||||
|
ack_printf("! %s", banner);
|
||||||
|
if (dialect == ACK) {
|
||||||
|
/* Declare the four sections used under Minix. */
|
||||||
|
ack_printf(
|
||||||
|
"\n.sect .text; .sect .rom; .sect .data; .sect .bss\n.sect .text");
|
||||||
|
}
|
||||||
|
|
||||||
|
/* Initialize the opcode to mnemonic translation table. */
|
||||||
|
for (mp= mnemtab; mp < arraylimit(mnemtab); mp++) {
|
||||||
|
assert(opcode2name_tab[mp->opcode] == nil);
|
||||||
|
opcode2name_tab[mp->opcode]= mp->name;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
#define opcode2name(op) (opcode2name_tab[op] + 0)
|
||||||
|
|
||||||
|
static void ack_put_string(const char *s, size_t n)
|
||||||
|
/* Emit a string with weird characters quoted. */
|
||||||
|
{
|
||||||
|
while (n > 0) {
|
||||||
|
int c= *s;
|
||||||
|
|
||||||
|
if (c < ' ' || c > 0177) {
|
||||||
|
ack_printf("\\%03o", c & 0xFF);
|
||||||
|
} else
|
||||||
|
if (c == '"' || c == '\\') {
|
||||||
|
ack_printf("\\%c", c);
|
||||||
|
} else {
|
||||||
|
ack_putchar(c);
|
||||||
|
}
|
||||||
|
s++;
|
||||||
|
n--;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
static void ack_put_expression(asm86_t *a, expression_t *e, int deref)
|
||||||
|
/* Send an expression, i.e. instruction operands, to the output file. Deref
|
||||||
|
* is true when the rewrite for the ncc dialect may be made.
|
||||||
|
*/
|
||||||
|
{
|
||||||
|
int isglob;
|
||||||
|
|
||||||
|
assert(e != nil);
|
||||||
|
|
||||||
|
isglob = syms_is_global(e->name);
|
||||||
|
|
||||||
|
switch (e->operator) {
|
||||||
|
case ',':
|
||||||
|
if (dialect == NCC && farjmp(a->opcode)) {
|
||||||
|
/* ACK jmpf seg:off -> NCC jmpf off,seg */
|
||||||
|
ack_put_expression(a, e->right, deref);
|
||||||
|
ack_printf(", ");
|
||||||
|
ack_put_expression(a, e->left, deref);
|
||||||
|
} else {
|
||||||
|
ack_put_expression(a, e->left, deref);
|
||||||
|
ack_printf(farjmp(a->opcode) ? ":" : ", ");
|
||||||
|
ack_put_expression(a, e->right, deref);
|
||||||
|
}
|
||||||
|
break;
|
||||||
|
case 'O':
|
||||||
|
if (deref && a->optype == JUMP) ack_putchar('@');
|
||||||
|
if (e->left != nil) ack_put_expression(a, e->left, 0);
|
||||||
|
if (e->middle != nil) ack_put_expression(a, e->middle, 0);
|
||||||
|
if (e->right != nil) ack_put_expression(a, e->right, 0);
|
||||||
|
break;
|
||||||
|
case '(':
|
||||||
|
if (deref && a->optype == JUMP) ack_putchar('@');
|
||||||
|
if (!deref) ack_putchar('(');
|
||||||
|
ack_put_expression(a, e->middle, 0);
|
||||||
|
if (!deref) ack_putchar(')');
|
||||||
|
break;
|
||||||
|
case 'B':
|
||||||
|
ack_printf("(%s%s)", isglob ? "_" : "", e->name);
|
||||||
|
break;
|
||||||
|
case '1':
|
||||||
|
case '2':
|
||||||
|
case '4':
|
||||||
|
case '8':
|
||||||
|
ack_printf((use16() && e->operator == '1')
|
||||||
|
? "(%s%s)" : "(%s%s*%c)", isglob ? "_" : "",
|
||||||
|
e->name, e->operator);
|
||||||
|
break;
|
||||||
|
case '+':
|
||||||
|
case '-':
|
||||||
|
case '~':
|
||||||
|
if (e->middle != nil) {
|
||||||
|
if (deref && a->optype != JUMP) ack_putchar('#');
|
||||||
|
ack_putchar(e->operator);
|
||||||
|
ack_put_expression(a, e->middle, 0);
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
/*FALL THROUGH*/
|
||||||
|
case '*':
|
||||||
|
case '/':
|
||||||
|
case '%':
|
||||||
|
case '&':
|
||||||
|
case '|':
|
||||||
|
case '^':
|
||||||
|
case S_LEFTSHIFT:
|
||||||
|
case S_RIGHTSHIFT:
|
||||||
|
if (deref && a->optype != JUMP) ack_putchar('#');
|
||||||
|
ack_put_expression(a, e->left, 0);
|
||||||
|
if (e->operator == S_LEFTSHIFT) {
|
||||||
|
ack_printf("<<");
|
||||||
|
} else
|
||||||
|
if (e->operator == S_RIGHTSHIFT) {
|
||||||
|
ack_printf(">>");
|
||||||
|
} else {
|
||||||
|
ack_putchar(e->operator);
|
||||||
|
}
|
||||||
|
ack_put_expression(a, e->right, 0);
|
||||||
|
break;
|
||||||
|
case '[':
|
||||||
|
if (deref && a->optype != JUMP) ack_putchar('#');
|
||||||
|
ack_putchar('[');
|
||||||
|
ack_put_expression(a, e->middle, 0);
|
||||||
|
ack_putchar(']');
|
||||||
|
break;
|
||||||
|
case 'W':
|
||||||
|
if (deref && a->optype == JUMP && isregister(e->name))
|
||||||
|
{
|
||||||
|
ack_printf("(%s)", e->name);
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
if (deref && a->optype != JUMP && !isregister(e->name)) {
|
||||||
|
ack_putchar('#');
|
||||||
|
}
|
||||||
|
ack_printf("%s%s", isglob ? "_" : "", e->name);
|
||||||
|
break;
|
||||||
|
case 'S':
|
||||||
|
ack_putchar('"');
|
||||||
|
ack_put_string(e->name, e->len);
|
||||||
|
ack_putchar('"');
|
||||||
|
break;
|
||||||
|
default:
|
||||||
|
fprintf(stderr,
|
||||||
|
"asmconv: internal error, unknown expression operator '%d'\n",
|
||||||
|
e->operator);
|
||||||
|
exit(EXIT_FAILURE);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
void ack_emit_instruction(asm86_t *a)
|
||||||
|
/* Output one instruction and its operands. */
|
||||||
|
{
|
||||||
|
int same= 0;
|
||||||
|
char *p;
|
||||||
|
static int high_seg;
|
||||||
|
int deref;
|
||||||
|
static int prevop;
|
||||||
|
|
||||||
|
if (a == nil) {
|
||||||
|
/* Last call */
|
||||||
|
ack_putchar('\n');
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
|
/* Make sure the line number of the line to be emitted is ok. */
|
||||||
|
if ((a->file != efile && strcmp(a->file, efile) != 0)
|
||||||
|
|| a->line < eline || a->line > eline+10) {
|
||||||
|
ack_putchar('\n');
|
||||||
|
ack_printf("! %ld \"%s\"\n", a->line, a->file);
|
||||||
|
efile= a->file;
|
||||||
|
eline= a->line;
|
||||||
|
} else {
|
||||||
|
if (a->line == eline) {
|
||||||
|
if (prevop == DOT_LABEL) {
|
||||||
|
ack_printf("\n");
|
||||||
|
same = 0;
|
||||||
|
}
|
||||||
|
else {
|
||||||
|
ack_printf("; ");
|
||||||
|
same= 1;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
while (eline < a->line) {
|
||||||
|
ack_putchar('\n');
|
||||||
|
eline++;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
if (a->opcode == DOT_LABEL)
|
||||||
|
prevop = DOT_LABEL;
|
||||||
|
else
|
||||||
|
prevop = 0;
|
||||||
|
|
||||||
|
if (a->opcode == COMMENT ||
|
||||||
|
a->opcode == C_PREPROCESSOR ||
|
||||||
|
a->opcode == UNKNOWN) {
|
||||||
|
if (a->opcode == COMMENT)
|
||||||
|
if (a->raw_string[0] != '/')
|
||||||
|
a->raw_string[0] = '!';
|
||||||
|
ack_printf("%s", a->raw_string);
|
||||||
|
return;
|
||||||
|
} else
|
||||||
|
if (a->opcode == DOT_LABEL) {
|
||||||
|
assert(a->args->operator == ':');
|
||||||
|
if (syms_is_global(a->args->name))
|
||||||
|
ack_printf("_%s:", a->args->name);
|
||||||
|
else
|
||||||
|
ack_printf("%s:", a->args->name);
|
||||||
|
} else
|
||||||
|
if (a->opcode == DOT_EQU) {
|
||||||
|
assert(a->args->operator == '=');
|
||||||
|
ack_printf("\t%s = ", a->args->name);
|
||||||
|
ack_put_expression(a, a->args->middle, 0);
|
||||||
|
} else
|
||||||
|
if ((p= opcode2name(a->opcode)) != nil) {
|
||||||
|
char *sep= dialect == ACK ? "" : ";";
|
||||||
|
|
||||||
|
if (!is_pseudo(a->opcode) && !same) ack_putchar('\t');
|
||||||
|
|
||||||
|
switch (a->rep) {
|
||||||
|
case ONCE: break;
|
||||||
|
case REP: ack_printf("rep"); break;
|
||||||
|
case REPE: ack_printf("repe"); break;
|
||||||
|
case REPNE: ack_printf("repne"); break;
|
||||||
|
default: assert(0);
|
||||||
|
}
|
||||||
|
if (a->rep != ONCE) {
|
||||||
|
ack_printf(dialect == ACK ? " " : "; ");
|
||||||
|
}
|
||||||
|
switch (a->seg) {
|
||||||
|
case DEFSEG: break;
|
||||||
|
case CSEG: ack_printf("cseg"); break;
|
||||||
|
case DSEG: ack_printf("dseg"); break;
|
||||||
|
case ESEG: ack_printf("eseg"); break;
|
||||||
|
case FSEG: ack_printf("fseg"); break;
|
||||||
|
case GSEG: ack_printf("gseg"); break;
|
||||||
|
case SSEG: ack_printf("sseg"); break;
|
||||||
|
default: assert(0);
|
||||||
|
}
|
||||||
|
if (a->seg != DEFSEG) {
|
||||||
|
ack_printf(dialect == ACK ? " " : "; ");
|
||||||
|
}
|
||||||
|
if (a->oaz & OPZ) ack_printf(use16() ? "o32 " : "o16 ");
|
||||||
|
if (a->oaz & ADZ) ack_printf(use16() ? "a32 " : "a16 ");
|
||||||
|
|
||||||
|
if (a->opcode == CBW) {
|
||||||
|
p= !(a->oaz & OPZ) == use16() ? "cbw" : "cwde";
|
||||||
|
}
|
||||||
|
|
||||||
|
if (a->opcode == CWD) {
|
||||||
|
p= !(a->oaz & OPZ) == use16() ? "cwd" : "cdq";
|
||||||
|
}
|
||||||
|
|
||||||
|
if (a->opcode == DOT_COMM && a->args != nil
|
||||||
|
&& a->args->operator == ','
|
||||||
|
&& a->args->left->operator == 'W'
|
||||||
|
) {
|
||||||
|
if (syms_is_global(a->args->left->name))
|
||||||
|
ack_printf(".define\t_%s; ", a->args->left->name);
|
||||||
|
else
|
||||||
|
ack_printf(".define\t%s; ", a->args->left->name);
|
||||||
|
}
|
||||||
|
#define IS_OP_CR4(r) ((r) && (r)->name && strcmp((r)->name, "cr4") == 0)
|
||||||
|
/* unsupported mov to/from cr4 */
|
||||||
|
if (a->opcode == MOV && a->args->operator == ',') {
|
||||||
|
if (IS_OP_CR4(a->args->left)) {
|
||||||
|
/* read cr4 */
|
||||||
|
ack_printf(".data1 0x0f, 0x20, 0xe0\n");
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
if (IS_OP_CR4(a->args->right)) {
|
||||||
|
/* write cr4 */
|
||||||
|
ack_printf(".data1 0x0f, 0x22, 0xe0\n");
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
/* we are translating from GNU */
|
||||||
|
if (a->args && a->args->operator == ','
|
||||||
|
/* don't swap ljmp prefixed with segment */
|
||||||
|
&& a->opcode != JMPF) {
|
||||||
|
expression_t * tmp;
|
||||||
|
|
||||||
|
tmp = a->args->right;
|
||||||
|
a->args->right = a->args->left;
|
||||||
|
a->args->left = tmp;
|
||||||
|
}
|
||||||
|
while (*p != 0) {
|
||||||
|
if (*p == '%') {
|
||||||
|
if (a->optype == BYTE) ack_putchar('b');
|
||||||
|
} else {
|
||||||
|
ack_putchar(*p);
|
||||||
|
}
|
||||||
|
p++;
|
||||||
|
}
|
||||||
|
/*
|
||||||
|
* gnu assembly expresses the ES segment in the long instruction
|
||||||
|
* format. Not neccessary in ack
|
||||||
|
*/
|
||||||
|
if (a->opcode == MOVS)
|
||||||
|
return;
|
||||||
|
if (a->args != nil) {
|
||||||
|
ack_putchar('\t');
|
||||||
|
switch (a->opcode) {
|
||||||
|
case IN:
|
||||||
|
case OUT:
|
||||||
|
case INT:
|
||||||
|
deref= 0;
|
||||||
|
break;
|
||||||
|
default:
|
||||||
|
deref= (dialect == NCC && a->optype != PSEUDO);
|
||||||
|
}
|
||||||
|
ack_put_expression(a, a->args, deref);
|
||||||
|
}
|
||||||
|
if (a->opcode == DOT_USE16) set_use16();
|
||||||
|
if (a->opcode == DOT_USE32) set_use32();
|
||||||
|
} else {
|
||||||
|
fprintf(stderr,
|
||||||
|
"asmconv: internal error, unknown opcode '%d'\n",
|
||||||
|
a->opcode);
|
||||||
|
exit(EXIT_FAILURE);
|
||||||
|
}
|
||||||
|
|
||||||
|
/*
|
||||||
|
* comment on the same line as an instruction. Cannot be definition of a
|
||||||
|
* macro
|
||||||
|
* */
|
||||||
|
if (a->raw_string) {
|
||||||
|
if (a->raw_string[0] != '/')
|
||||||
|
a->raw_string[0] = '!';
|
||||||
|
ack_printf("\t%s", a->raw_string);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
/* A few ncc mnemonics are different. */
|
||||||
|
static mnemonic_t ncc_mnemtab[] = {
|
||||||
|
{ DOT_BSS, ".bss" },
|
||||||
|
{ DOT_DATA, ".data" },
|
||||||
|
{ DOT_END, ".end" },
|
||||||
|
{ DOT_ROM, ".rom" },
|
||||||
|
{ DOT_TEXT, ".text" },
|
||||||
|
};
|
||||||
|
|
||||||
|
void ncc_emit_init(char *file, const char *banner)
|
||||||
|
/* The assembly produced by the Minix ACK ANSI C compiler for the 8086 is
|
||||||
|
* different from the normal ACK assembly, and different from the old K&R
|
||||||
|
* assembler. This brings us endless joy. (It was supposed to make
|
||||||
|
* translation of the assembly used by the old K&R assembler easier by
|
||||||
|
* not deviating too much from that dialect.)
|
||||||
|
*/
|
||||||
|
{
|
||||||
|
mnemonic_t *mp;
|
||||||
|
|
||||||
|
dialect= NCC;
|
||||||
|
ack_emit_init(file, banner);
|
||||||
|
|
||||||
|
/* Replace a few mnemonics. */
|
||||||
|
for (mp= ncc_mnemtab; mp < arraylimit(ncc_mnemtab); mp++) {
|
||||||
|
opcode2name_tab[mp->opcode]= mp->name;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
void ncc_emit_instruction(asm86_t *a)
|
||||||
|
{
|
||||||
|
ack_emit_instruction(a);
|
||||||
|
}
|
116
commands/i386/gas2ack/gas2ack.c
Normal file
116
commands/i386/gas2ack/gas2ack.c
Normal file
|
@ -0,0 +1,116 @@
|
||||||
|
/* asmconv 1.11 - convert 80X86 assembly Author: Kees J. Bot
|
||||||
|
* 24 Dec 1993
|
||||||
|
*/
|
||||||
|
static char version[] = "1.11";
|
||||||
|
|
||||||
|
#define nil 0
|
||||||
|
#include <stdio.h>
|
||||||
|
#include <stdarg.h>
|
||||||
|
#include <stdlib.h>
|
||||||
|
#include <string.h>
|
||||||
|
#include <errno.h>
|
||||||
|
#include <assert.h>
|
||||||
|
#include "asmconv.h"
|
||||||
|
#include "asm86.h"
|
||||||
|
#include "languages.h"
|
||||||
|
|
||||||
|
void fatal(char *label)
|
||||||
|
{
|
||||||
|
fprintf(stderr, "asmconv: %s: %s\n", label, strerror(errno));
|
||||||
|
exit(EXIT_FAILURE);
|
||||||
|
}
|
||||||
|
|
||||||
|
void *allocate(void *mem, size_t size)
|
||||||
|
/* A checked malloc/realloc(). Yes, I know ISO C allows realloc(NULL, size). */
|
||||||
|
{
|
||||||
|
mem= mem == nil ? malloc(size) : realloc(mem, size);
|
||||||
|
if (mem == nil) fatal("malloc()");
|
||||||
|
return mem;
|
||||||
|
}
|
||||||
|
|
||||||
|
void deallocate(void *mem)
|
||||||
|
/* Free a malloc()d cell. (Yes I know ISO C allows free(NULL) */
|
||||||
|
{
|
||||||
|
if (mem != nil) free(mem);
|
||||||
|
}
|
||||||
|
|
||||||
|
char *copystr(const char *s)
|
||||||
|
{
|
||||||
|
char *c;
|
||||||
|
|
||||||
|
c= allocate(nil, (strlen(s) + 1) * sizeof(s[0]));
|
||||||
|
strcpy(c, s);
|
||||||
|
return c;
|
||||||
|
}
|
||||||
|
|
||||||
|
int isanumber(const char *s)
|
||||||
|
/* True if s can be turned into a number. */
|
||||||
|
{
|
||||||
|
char *end;
|
||||||
|
|
||||||
|
(void) strtol(s, &end, 0);
|
||||||
|
return end != s && *end == 0;
|
||||||
|
}
|
||||||
|
|
||||||
|
/* "Invisible" globals. */
|
||||||
|
int asm_mode32= (sizeof(int) == 4);
|
||||||
|
int err_code= EXIT_SUCCESS;
|
||||||
|
|
||||||
|
int main(int argc, char **argv)
|
||||||
|
{
|
||||||
|
void (*parse_init)(char *file);
|
||||||
|
asm86_t *(*get_instruction)(void);
|
||||||
|
void (*emit_init)(char *file, const char *banner);
|
||||||
|
void (*emit_instruction)(asm86_t *instr);
|
||||||
|
char *lang_parse, *lang_emit, *input_file, *output_file;
|
||||||
|
asm86_t *instr;
|
||||||
|
char banner[80];
|
||||||
|
|
||||||
|
if (argc > 1 && argv[1][0] == '-' && argv[1][1] == 'm') {
|
||||||
|
if (strcmp(argv[1], "-mi86") == 0) {
|
||||||
|
set_use16();
|
||||||
|
} else
|
||||||
|
if (strcmp(argv[1], "-mi386") == 0) {
|
||||||
|
set_use32();
|
||||||
|
} else {
|
||||||
|
fprintf(stderr, "asmconv: '%s': unknown machine\n",
|
||||||
|
argv[1]+2);
|
||||||
|
}
|
||||||
|
argc--;
|
||||||
|
argv++;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (argc > 3) {
|
||||||
|
fprintf(stderr, "Usage: gas2ack [input-file [output-file]]\n");
|
||||||
|
exit(EXIT_FAILURE);
|
||||||
|
}
|
||||||
|
|
||||||
|
input_file= argc < 1 ? nil : argv[1];
|
||||||
|
output_file= argc < 2 ? nil : argv[2];
|
||||||
|
|
||||||
|
parse_init= gnu_parse_init;
|
||||||
|
get_instruction= gnu_get_instruction;
|
||||||
|
|
||||||
|
emit_init= ack_emit_init;
|
||||||
|
emit_instruction= ack_emit_instruction;
|
||||||
|
|
||||||
|
sprintf(banner, "Translated from GNU to ACK by gas2ack");
|
||||||
|
|
||||||
|
/* get localy defined labels first */
|
||||||
|
(*parse_init)(input_file);
|
||||||
|
for (;;) {
|
||||||
|
instr= (*get_instruction)();
|
||||||
|
if (instr == nil) break;
|
||||||
|
del_asm86(instr);
|
||||||
|
}
|
||||||
|
|
||||||
|
(*parse_init)(input_file);
|
||||||
|
(*emit_init)(output_file, banner);
|
||||||
|
for (;;) {
|
||||||
|
instr= (*get_instruction)();
|
||||||
|
(*emit_instruction)(instr);
|
||||||
|
if (instr == nil) break;
|
||||||
|
del_asm86(instr);
|
||||||
|
}
|
||||||
|
exit(err_code);
|
||||||
|
}
|
134
commands/i386/gas2ack/globals.c
Normal file
134
commands/i386/gas2ack/globals.c
Normal file
|
@ -0,0 +1,134 @@
|
||||||
|
/*
|
||||||
|
* Table of all global definitions. Since the ack convention is to prepend
|
||||||
|
* syms with '_' for C interfacing, we need to know about them and add/remove
|
||||||
|
* teh '_' as neccessary
|
||||||
|
*/
|
||||||
|
|
||||||
|
#include <errno.h>
|
||||||
|
#include <string.h>
|
||||||
|
#include <ctype.h>
|
||||||
|
#include <stdio.h>
|
||||||
|
|
||||||
|
#include "asm86.h"
|
||||||
|
|
||||||
|
/* this should be fine for common minix assembly files */
|
||||||
|
#define SYM_MAX 1024
|
||||||
|
#define SYM_MAX_LEN 64
|
||||||
|
|
||||||
|
struct sym {
|
||||||
|
char name[SYM_MAX_LEN];
|
||||||
|
int gl;
|
||||||
|
};
|
||||||
|
|
||||||
|
static struct sym syms[SYM_MAX];
|
||||||
|
|
||||||
|
static int syms_num = 0;
|
||||||
|
|
||||||
|
static struct sym * sym_exists(const char * n)
|
||||||
|
{
|
||||||
|
int i;
|
||||||
|
|
||||||
|
for (i = 0; i < syms_num; i++) {
|
||||||
|
if (strcmp(syms[i].name, n) == 0)
|
||||||
|
return &syms[i];
|
||||||
|
}
|
||||||
|
|
||||||
|
return NULL;
|
||||||
|
}
|
||||||
|
|
||||||
|
static int is_local_label_ref(const char *n)
|
||||||
|
{
|
||||||
|
int i;
|
||||||
|
int l = strlen(n);
|
||||||
|
|
||||||
|
for(i = 0; i < l - 1; i++)
|
||||||
|
if (!isdigit(n[i]))
|
||||||
|
return 0;
|
||||||
|
if (n[l-1] != 'b' && n[l-1] != 'f')
|
||||||
|
return 0;
|
||||||
|
|
||||||
|
return 1;
|
||||||
|
}
|
||||||
|
|
||||||
|
static int is_hex(const char *n)
|
||||||
|
{
|
||||||
|
int i;
|
||||||
|
for(i = 0; n[i]; i++)
|
||||||
|
if (!isxdigit(n[i]))
|
||||||
|
return 0;
|
||||||
|
return 1;
|
||||||
|
}
|
||||||
|
|
||||||
|
static int is_dec(const char *n)
|
||||||
|
{
|
||||||
|
int i;
|
||||||
|
for(i = 0; n[i]; i++)
|
||||||
|
if (!isdigit(n[i]))
|
||||||
|
return 0;
|
||||||
|
return 1;
|
||||||
|
}
|
||||||
|
|
||||||
|
static int is_number(const char * n)
|
||||||
|
{
|
||||||
|
if (n[0] == '0' && n[1] == 'x')
|
||||||
|
return is_hex(n + 2);
|
||||||
|
else
|
||||||
|
return is_dec(n);
|
||||||
|
}
|
||||||
|
|
||||||
|
int syms_is_global(const char * n)
|
||||||
|
{
|
||||||
|
struct sym *s;
|
||||||
|
|
||||||
|
if (!n || is_number(n) || is_local_label_ref(n) || isregister(n))
|
||||||
|
return 0;
|
||||||
|
|
||||||
|
/* if not found, it must be extern -> global */
|
||||||
|
if (!(s = sym_exists(n)))
|
||||||
|
return 1;
|
||||||
|
|
||||||
|
return s->gl;
|
||||||
|
}
|
||||||
|
|
||||||
|
static int add(const char * n, int isgl)
|
||||||
|
{
|
||||||
|
if (syms_num >= SYM_MAX)
|
||||||
|
return -ENOMEM;
|
||||||
|
if (!n || strlen(n) >= SYM_MAX_LEN)
|
||||||
|
return -EINVAL;
|
||||||
|
|
||||||
|
/* ignore numbers */
|
||||||
|
if (is_number(n))
|
||||||
|
return 0;
|
||||||
|
|
||||||
|
strcpy(syms[syms_num].name, n);
|
||||||
|
syms[syms_num].gl = isgl;
|
||||||
|
syms_num++;
|
||||||
|
|
||||||
|
return 0;
|
||||||
|
}
|
||||||
|
|
||||||
|
int syms_add(const char *n)
|
||||||
|
{
|
||||||
|
return add(n, 0);
|
||||||
|
}
|
||||||
|
|
||||||
|
int syms_add_global(const char *n)
|
||||||
|
{
|
||||||
|
return add(n, 1);
|
||||||
|
}
|
||||||
|
|
||||||
|
void syms_add_global_csl(expression_t * exp)
|
||||||
|
{
|
||||||
|
if (!exp)
|
||||||
|
return;
|
||||||
|
|
||||||
|
if (exp->operator == ',') {
|
||||||
|
syms_add_global_csl(exp->left);
|
||||||
|
syms_add_global_csl(exp->right);
|
||||||
|
}
|
||||||
|
else {
|
||||||
|
syms_add_global(exp->name);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
9
commands/i386/gas2ack/globals.h
Normal file
9
commands/i386/gas2ack/globals.h
Normal file
|
@ -0,0 +1,9 @@
|
||||||
|
#ifndef __GLOBALS_H__
|
||||||
|
#define __GLOBALS_H__
|
||||||
|
|
||||||
|
int syms_is_global(const char * gl);
|
||||||
|
int syms_add(const char * gl);
|
||||||
|
int syms_add_global(const char * gl);
|
||||||
|
void syms_add_global_csl(expression_t * exp);
|
||||||
|
|
||||||
|
#endif
|
25
commands/i386/gas2ack/languages.h
Normal file
25
commands/i386/gas2ack/languages.h
Normal file
|
@ -0,0 +1,25 @@
|
||||||
|
/* languages.h - functions that parse or emit assembly
|
||||||
|
* Author: Kees J. Bot
|
||||||
|
* 27 Dec 1993
|
||||||
|
*/
|
||||||
|
|
||||||
|
void ack_parse_init(char *file);
|
||||||
|
asm86_t *ack_get_instruction(void);
|
||||||
|
|
||||||
|
void ncc_parse_init(char *file);
|
||||||
|
asm86_t *ncc_get_instruction(void);
|
||||||
|
|
||||||
|
void gnu_parse_init(char *file);
|
||||||
|
asm86_t *gnu_get_instruction(void);
|
||||||
|
|
||||||
|
void bas_parse_init(char *file);
|
||||||
|
asm86_t *bas_get_instruction(void);
|
||||||
|
|
||||||
|
void ack_emit_init(char *file, const char *banner);
|
||||||
|
void ack_emit_instruction(asm86_t *instr);
|
||||||
|
|
||||||
|
void ncc_emit_init(char *file, const char *banner);
|
||||||
|
void ncc_emit_instruction(asm86_t *instr);
|
||||||
|
|
||||||
|
void gnu_emit_init(char *file, const char *banner);
|
||||||
|
void gnu_emit_instruction(asm86_t *instr);
|
1017
commands/i386/gas2ack/parse_gnu.c
Normal file
1017
commands/i386/gas2ack/parse_gnu.c
Normal file
File diff suppressed because it is too large
Load diff
32
commands/i386/gas2ack/token.h
Normal file
32
commands/i386/gas2ack/token.h
Normal file
|
@ -0,0 +1,32 @@
|
||||||
|
/* token.h - token definition Author: Kees J. Bot
|
||||||
|
* 13 Dec 1993
|
||||||
|
*/
|
||||||
|
|
||||||
|
typedef enum toktype {
|
||||||
|
T_EOF,
|
||||||
|
T_CHAR,
|
||||||
|
T_WORD,
|
||||||
|
T_STRING,
|
||||||
|
T_COMMENT,
|
||||||
|
T_C_PREPROCESSOR
|
||||||
|
} toktype_t;
|
||||||
|
|
||||||
|
typedef struct token {
|
||||||
|
struct token *next;
|
||||||
|
long line;
|
||||||
|
toktype_t type;
|
||||||
|
int symbol; /* Single character symbol. */
|
||||||
|
char *name; /* Word, number, etc. */
|
||||||
|
size_t len; /* Length of string. */
|
||||||
|
} token_t;
|
||||||
|
|
||||||
|
#define S_LEFTSHIFT 0x100 /* << */
|
||||||
|
#define S_RIGHTSHIFT 0x101 /* >> */
|
||||||
|
|
||||||
|
void set_file(char *file, long line);
|
||||||
|
void get_file(char **file, long *line);
|
||||||
|
void parse_err(int err, token_t *where, const char *fmt, ...);
|
||||||
|
void parse_warn(int err, token_t *t, const char *fmt, ...);
|
||||||
|
void tok_init(char *file, int comment);
|
||||||
|
token_t *get_token(int n);
|
||||||
|
void skip_token(int n);
|
410
commands/i386/gas2ack/tokenize.c
Normal file
410
commands/i386/gas2ack/tokenize.c
Normal file
|
@ -0,0 +1,410 @@
|
||||||
|
/* tokenize.c - split input into tokens Author: Kees J. Bot
|
||||||
|
* 13 Dec 1993
|
||||||
|
*/
|
||||||
|
#define nil 0
|
||||||
|
#include <stdio.h>
|
||||||
|
#include <stdarg.h>
|
||||||
|
#include <stdlib.h>
|
||||||
|
#include <string.h>
|
||||||
|
#include <assert.h>
|
||||||
|
#include "asmconv.h"
|
||||||
|
#include "token.h"
|
||||||
|
|
||||||
|
static FILE *tf;
|
||||||
|
static char *tfile;
|
||||||
|
static char *orig_tfile;
|
||||||
|
static int tcomment;
|
||||||
|
static int tc;
|
||||||
|
static long tline;
|
||||||
|
static token_t *tq;
|
||||||
|
static int nl, prevnl;
|
||||||
|
|
||||||
|
static int old_n= 0; /* To speed up n, n+1, n+2, ... accesses. */
|
||||||
|
static token_t **old_ptq= &tq;
|
||||||
|
|
||||||
|
static void tok_reset(void)
|
||||||
|
{
|
||||||
|
nl = prevnl = 0;
|
||||||
|
tline = 0;
|
||||||
|
if (tf)
|
||||||
|
fclose(tf); /* ignore error */
|
||||||
|
tf = NULL;
|
||||||
|
old_n = 0;
|
||||||
|
old_ptq = &tq;
|
||||||
|
tq = NULL;
|
||||||
|
}
|
||||||
|
|
||||||
|
static void readtc(void)
|
||||||
|
/* Read one character from the input file and put it in the global 'tc'. */
|
||||||
|
{
|
||||||
|
if (nl) tline++;
|
||||||
|
if ((tc= getc(tf)) == EOF && ferror(tf)) fatal(orig_tfile);
|
||||||
|
prevnl = nl;
|
||||||
|
nl= (tc == '\n');
|
||||||
|
}
|
||||||
|
|
||||||
|
static void unreadtc(int tc)
|
||||||
|
{
|
||||||
|
if (tc == '\n')
|
||||||
|
tline--;
|
||||||
|
nl = prevnl;
|
||||||
|
ungetc(tc, tf);
|
||||||
|
}
|
||||||
|
|
||||||
|
void set_file(char *file, long line)
|
||||||
|
/* Set file name and line number, changed by a preprocessor trick. */
|
||||||
|
{
|
||||||
|
deallocate(tfile);
|
||||||
|
tfile= allocate(nil, (strlen(file) + 1) * sizeof(tfile[0]));
|
||||||
|
strcpy(tfile, file);
|
||||||
|
tline= line;
|
||||||
|
}
|
||||||
|
|
||||||
|
void get_file(char **file, long *line)
|
||||||
|
/* Get file name and line number. */
|
||||||
|
{
|
||||||
|
*file= tfile;
|
||||||
|
*line= tline;
|
||||||
|
}
|
||||||
|
|
||||||
|
void parse_err(int err, token_t *t, const char *fmt, ...)
|
||||||
|
/* Report a parsing error. */
|
||||||
|
{
|
||||||
|
va_list ap;
|
||||||
|
|
||||||
|
fprintf(stderr, "* error : \"%s\", line %ld: ", tfile,
|
||||||
|
t == nil ? tline : t->line);
|
||||||
|
va_start(ap, fmt);
|
||||||
|
vfprintf(stderr, fmt, ap);
|
||||||
|
va_end(ap);
|
||||||
|
if (err) set_error();
|
||||||
|
}
|
||||||
|
|
||||||
|
void parse_warn(int err, token_t *t, const char *fmt, ...)
|
||||||
|
/* Report a parsing error. */
|
||||||
|
{
|
||||||
|
va_list ap;
|
||||||
|
|
||||||
|
fprintf(stderr, "warning : \"%s\", line %ld: ", tfile,
|
||||||
|
t == nil ? tline : t->line);
|
||||||
|
va_start(ap, fmt);
|
||||||
|
vfprintf(stderr, fmt, ap);
|
||||||
|
va_end(ap);
|
||||||
|
}
|
||||||
|
|
||||||
|
void tok_init(char *file, int comment)
|
||||||
|
/* Open the file to tokenize and initialize the tokenizer. */
|
||||||
|
{
|
||||||
|
tok_reset();
|
||||||
|
|
||||||
|
if (file == nil) {
|
||||||
|
file= "stdin";
|
||||||
|
tf= stdin;
|
||||||
|
} else {
|
||||||
|
if ((tf= fopen(file, "r")) == nil) fatal(file);
|
||||||
|
}
|
||||||
|
orig_tfile= file;
|
||||||
|
set_file(file, 1);
|
||||||
|
readtc();
|
||||||
|
tcomment= comment;
|
||||||
|
}
|
||||||
|
|
||||||
|
static int isspace(int c)
|
||||||
|
{
|
||||||
|
return between('\0', c, ' ') && c != '\n';
|
||||||
|
}
|
||||||
|
|
||||||
|
#define iscomment(c) ((c) == tcomment)
|
||||||
|
|
||||||
|
static int isidentchar(int c)
|
||||||
|
{
|
||||||
|
return between('a', c, 'z')
|
||||||
|
|| between('A', c, 'Z')
|
||||||
|
|| between('0', c, '9')
|
||||||
|
|| c == '.'
|
||||||
|
|| c == '_'
|
||||||
|
;
|
||||||
|
}
|
||||||
|
|
||||||
|
static token_t *new_token(void)
|
||||||
|
{
|
||||||
|
token_t *new;
|
||||||
|
|
||||||
|
new= allocate(nil, sizeof(*new));
|
||||||
|
new->next= nil;
|
||||||
|
new->line= tline;
|
||||||
|
new->name= nil;
|
||||||
|
new->symbol= -1;
|
||||||
|
return new;
|
||||||
|
}
|
||||||
|
|
||||||
|
static token_t *get_word(void)
|
||||||
|
/* Read one word, an identifier, a number, a label, or a mnemonic. */
|
||||||
|
{
|
||||||
|
token_t *w;
|
||||||
|
char *name;
|
||||||
|
size_t i, len;
|
||||||
|
|
||||||
|
i= 0;
|
||||||
|
len= 16;
|
||||||
|
name= allocate(nil, len * sizeof(name[0]));
|
||||||
|
|
||||||
|
while (isidentchar(tc)) {
|
||||||
|
name[i++]= tc;
|
||||||
|
readtc();
|
||||||
|
if (i == len) name= allocate(name, (len*= 2) * sizeof(name[0]));
|
||||||
|
}
|
||||||
|
name[i]= 0;
|
||||||
|
name= allocate(name, (i+1) * sizeof(name[0]));
|
||||||
|
w= new_token();
|
||||||
|
w->type= T_WORD;
|
||||||
|
w->name= name;
|
||||||
|
w->len= i;
|
||||||
|
return w;
|
||||||
|
}
|
||||||
|
|
||||||
|
static token_t *get_string(void)
|
||||||
|
/* Read a single or double quotes delimited string. */
|
||||||
|
{
|
||||||
|
token_t *s;
|
||||||
|
int quote;
|
||||||
|
char *str;
|
||||||
|
size_t i, len;
|
||||||
|
int n, j;
|
||||||
|
int seen;
|
||||||
|
|
||||||
|
quote= tc;
|
||||||
|
readtc();
|
||||||
|
|
||||||
|
i= 0;
|
||||||
|
len= 16;
|
||||||
|
str= allocate(nil, len * sizeof(str[0]));
|
||||||
|
|
||||||
|
while (tc != quote && tc != '\n' && tc != EOF) {
|
||||||
|
seen= -1;
|
||||||
|
if (tc == '\\') {
|
||||||
|
readtc();
|
||||||
|
if (tc == '\n' || tc == EOF) break;
|
||||||
|
|
||||||
|
switch (tc) {
|
||||||
|
case 'a': tc= '\a'; break;
|
||||||
|
case 'b': tc= '\b'; break;
|
||||||
|
case 'f': tc= '\f'; break;
|
||||||
|
case 'n': tc= '\n'; break;
|
||||||
|
case 'r': tc= '\r'; break;
|
||||||
|
case 't': tc= '\t'; break;
|
||||||
|
case 'v': tc= '\v'; break;
|
||||||
|
case 'x':
|
||||||
|
n= 0;
|
||||||
|
for (j= 0; j < 3; j++) {
|
||||||
|
readtc();
|
||||||
|
if (between('0', tc, '9'))
|
||||||
|
tc-= '0' + 0x0;
|
||||||
|
else
|
||||||
|
if (between('A', tc, 'A'))
|
||||||
|
tc-= 'A' + 0xA;
|
||||||
|
else
|
||||||
|
if (between('a', tc, 'a'))
|
||||||
|
tc-= 'a' + 0xa;
|
||||||
|
else {
|
||||||
|
seen= tc;
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
n= n*0x10 + tc;
|
||||||
|
}
|
||||||
|
tc= n;
|
||||||
|
break;
|
||||||
|
default:
|
||||||
|
if (!between('0', tc, '9')) break;
|
||||||
|
n= 0;
|
||||||
|
for (j= 0; j < 3; j++) {
|
||||||
|
if (between('0', tc, '9'))
|
||||||
|
tc-= '0';
|
||||||
|
else {
|
||||||
|
seen= tc;
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
n= n*010 + tc;
|
||||||
|
readtc();
|
||||||
|
}
|
||||||
|
tc= n;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
str[i++]= tc;
|
||||||
|
if (i == len) str= allocate(str, (len*= 2) * sizeof(str[0]));
|
||||||
|
|
||||||
|
if (seen < 0) readtc(); else tc= seen;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (tc == quote) {
|
||||||
|
readtc();
|
||||||
|
} else {
|
||||||
|
parse_err(1, nil, "string contains newline\n");
|
||||||
|
}
|
||||||
|
str[i]= 0;
|
||||||
|
str= allocate(str, (i+1) * sizeof(str[0]));
|
||||||
|
s= new_token();
|
||||||
|
s->type= T_STRING;
|
||||||
|
s->name= str;
|
||||||
|
s->len= i;
|
||||||
|
return s;
|
||||||
|
}
|
||||||
|
|
||||||
|
#define MAX_TOKEN_STR_SIZE 4096
|
||||||
|
static char token_str[MAX_TOKEN_STR_SIZE];
|
||||||
|
static unsigned token_sz;
|
||||||
|
|
||||||
|
token_t *get_token(int n)
|
||||||
|
/* Return the n-th token on the input queue. */
|
||||||
|
{
|
||||||
|
token_t *t, **ptq;
|
||||||
|
|
||||||
|
assert(n >= 0);
|
||||||
|
|
||||||
|
if (0 && n >= old_n) {
|
||||||
|
/* Go forward from the previous point. */
|
||||||
|
n-= old_n;
|
||||||
|
old_n+= n;
|
||||||
|
ptq= old_ptq;
|
||||||
|
} else {
|
||||||
|
/* Restart from the head of the queue. */
|
||||||
|
old_n= n;
|
||||||
|
ptq= &tq;
|
||||||
|
}
|
||||||
|
|
||||||
|
for (;;) {
|
||||||
|
if ((t= *ptq) == nil) {
|
||||||
|
/* consume white spaces */
|
||||||
|
while (isspace(tc))
|
||||||
|
readtc();
|
||||||
|
/* read long C comments */
|
||||||
|
if (tc == '/') {
|
||||||
|
readtc();
|
||||||
|
if (tc != '*') {
|
||||||
|
unreadtc(tc);
|
||||||
|
tc = '/';
|
||||||
|
}
|
||||||
|
else {
|
||||||
|
token_sz = 2;
|
||||||
|
t = new_token();
|
||||||
|
t->type = T_COMMENT;
|
||||||
|
token_str[0] = '/';
|
||||||
|
token_str[1] = '*';
|
||||||
|
readtc();
|
||||||
|
for(;;) {
|
||||||
|
while (tc != EOF && tc != '/') {
|
||||||
|
token_str[token_sz++] = (char)tc;
|
||||||
|
readtc();
|
||||||
|
}
|
||||||
|
if (tc == '/') {
|
||||||
|
if (token_str[token_sz - 1] == '*') {
|
||||||
|
token_str[token_sz++] = (char)tc;
|
||||||
|
readtc();
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
token_str[token_sz++] = (char)tc;
|
||||||
|
readtc();
|
||||||
|
}
|
||||||
|
else if (tc == EOF)
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
token_str[token_sz] = 0;
|
||||||
|
t->name= malloc(token_sz + 1);
|
||||||
|
if (t->name == NULL) {
|
||||||
|
fprintf(stderr, "malloc() failed\n");
|
||||||
|
exit(-1);
|
||||||
|
}
|
||||||
|
strcpy(t->name, token_str);
|
||||||
|
t->len = token_sz;
|
||||||
|
goto token_found;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
if (iscomment(tc) || tc == '#') {
|
||||||
|
t = new_token();
|
||||||
|
if (iscomment(tc))
|
||||||
|
t->type = T_COMMENT;
|
||||||
|
else
|
||||||
|
t->type = T_C_PREPROCESSOR;
|
||||||
|
token_sz = 0;
|
||||||
|
for(;;) {
|
||||||
|
while (tc != '\n' && tc != EOF) {
|
||||||
|
token_str[token_sz++] = (char)tc;
|
||||||
|
readtc();
|
||||||
|
}
|
||||||
|
if (t->type == T_C_PREPROCESSOR &&
|
||||||
|
token_str[token_sz - 1] == '\\') {
|
||||||
|
token_str[token_sz++] = '\n';
|
||||||
|
tline++;
|
||||||
|
readtc();
|
||||||
|
}
|
||||||
|
else
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
token_str[token_sz] = 0;
|
||||||
|
t->name= malloc(token_sz + 1);
|
||||||
|
if (t->name == NULL) {
|
||||||
|
fprintf(stderr, "malloc() failed\n");
|
||||||
|
exit(-1);
|
||||||
|
}
|
||||||
|
strcpy(t->name, token_str);
|
||||||
|
t->len = token_sz;
|
||||||
|
goto token_found;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (tc == EOF) {
|
||||||
|
t= new_token();
|
||||||
|
t->type= T_EOF;
|
||||||
|
} else
|
||||||
|
if (isidentchar(tc)) {
|
||||||
|
t= get_word();
|
||||||
|
} else
|
||||||
|
if (tc == '\'' || tc == '"') {
|
||||||
|
t= get_string();
|
||||||
|
} else {
|
||||||
|
if (tc == '\n') tc= ';';
|
||||||
|
t= new_token();
|
||||||
|
t->type= T_CHAR;
|
||||||
|
t->symbol= tc;
|
||||||
|
readtc();
|
||||||
|
if (t->symbol == '<' && tc == '<') {
|
||||||
|
t->symbol= S_LEFTSHIFT;
|
||||||
|
readtc();
|
||||||
|
} else
|
||||||
|
if (t->symbol == '>' && tc == '>') {
|
||||||
|
t->symbol= S_RIGHTSHIFT;
|
||||||
|
readtc();
|
||||||
|
}
|
||||||
|
}
|
||||||
|
token_found:
|
||||||
|
*ptq= t;
|
||||||
|
}
|
||||||
|
if (n == 0) break;
|
||||||
|
n--;
|
||||||
|
ptq= &t->next;
|
||||||
|
}
|
||||||
|
old_ptq= ptq;
|
||||||
|
return t;
|
||||||
|
}
|
||||||
|
|
||||||
|
void skip_token(int n)
|
||||||
|
/* Remove n tokens from the input queue. One is not allowed to skip unread
|
||||||
|
* tokens.
|
||||||
|
*/
|
||||||
|
{
|
||||||
|
token_t *junk;
|
||||||
|
|
||||||
|
assert(n >= 0);
|
||||||
|
|
||||||
|
while (n > 0) {
|
||||||
|
assert(tq != nil);
|
||||||
|
|
||||||
|
junk= tq;
|
||||||
|
tq= tq->next;
|
||||||
|
deallocate(junk->name);
|
||||||
|
deallocate(junk);
|
||||||
|
n--;
|
||||||
|
}
|
||||||
|
/* Reset the old reference. */
|
||||||
|
old_n= 0;
|
||||||
|
old_ptq= &tq;
|
||||||
|
}
|
Loading…
Reference in a new issue