OBJ模型格式解析 (决不是硬编码)

instemast · 发表于 2008-4-5 14:03:00

首先是解析为2元式，核心算法和数据结构如下：

忘记支持下划线了，加上了~~只需要修改IsEng()内联函数

**需要完整代码编译的PM我**

( 解析速度的确很快(1瞬间！),但是仍然花了几十秒,但这是CStr类的问题..最近修正了 )

// if和goto语句请您用在IDE里面用TAB对齐了察看！
namespace obj
{

typedef struct _OBJ
{
UInt32 pos;
CStr text;

_OBJ(){pos=0;text=CStr();}
}OBJ;

typedef struct _TOKEN
{
CStr type, val;

_TOKEN(){type=CStr();val=CStr();}
_TOKEN(const CStr &t,const CStr &v){ type=t; val=v; }
}TOKEN;

__forceinline IsSpace(const WChar c){ return c==L' ' || c=='\t'; }
__forceinline IsEng(const WChar c){ return (c>=L'A'&&c<=L'Z') || (c>=L'a'&&c<=L'z') || c==L'_' || c>0xFF; }
__forceinline IsCrlf(const WChar c){ return c==10 || c==13; }
__forceinline IsNum(const WChar c){ return c>=L'0' && c<=L'9'; }

const WChar _R = L'r'; // return
const WChar _I = L'i'; // identifier or keyword
const WChar _N = L'n'; // number
const WChar _F = L'f'; // float
const WChar _D = L'/'; // symbol '/'
const WChar _E = L'\0';// end of file (use '\0')
const WChar _X = L'x'; // X - means 'error'

#define stop {__asm int 3};

TOKEN *NextToken(OBJ *obj)
{
UInt32 len = obj->text.GetLen();
const WChar *buf = obj->text.ReadW();
UInt32 &p = obj->pos;

WChar c=0;
CStr ret;
CStr t;

ST_S:
c=buf[p++];
if(c==0) {ret+=c;goto ST_END;}
if(c==L'#') { goto ST_SHARP;}
if(IsSpace(c)) { goto ST_S;}
if(IsCrlf(c)) {ret+=c;goto ST_CRLF;}
if(IsEng(c)) {ret+=c;goto ST_A;}
if(IsNum(c)) {ret+=c;goto ST_0;}
if(c==L'-') {ret+=c;goto ST_MINUS;}
if(c==L'/') {ret+=c;goto ST_DIV;}
if(c==L'\\') { goto ST_BS;}
else {ret=L"error at ST_S";goto ST_ERR;}

ST_DIV:
t=_D;
return new TOKEN(t,ret);

ST_SHARP:
c=buf[p++];
if(c==0) {ret+=c;goto ST_END;}
if(IsCrlf(c)) { goto ST_S;}
else {ret=L"error at ST_SHARP";goto ST_SHARP;}

ST_CRLF:
t=_R;
return new TOKEN(t,ret);

ST_BS:
c=buf[p++];
if(c==0) {ret+=c;goto ST_END;}
if(IsSpace(c)) { goto ST_BS;}
if(IsCrlf(c)) { goto ST_BS;}
if(IsEng(c)) {ret+=c;goto ST_A;}
if(IsNum(c)) {ret+=c;goto ST_0;}
if(c==L'-') {ret+=c;goto ST_MINUS;}
if(c==L'/') {ret+=c;goto ST_DIV;}
if(c==L'\\') { goto ST_BS;}
else {ret=L"error at ST_BS";goto ST_ERR;}

ST_A:
c=buf[p++];
t=_I;
if(c==0) { goto ST_W_END;}
if(IsEng(c)) {ret+=c;goto ST_A;}
if(IsNum(c)) {ret+=c;goto ST_A;}
if(IsSpace(c)) { goto ST_W_SPACE;}
if(IsCrlf(c)) { goto ST_W_CRLF;}
if(c==L'\\') { goto ST_W_BS;}
if(c==L'/') { goto ST_W_DIV;}
else {ret=L"error at ST_A";goto ST_ERR;}

ST_W_BS:
p--;
return new TOKEN(t,ret);

ST_W_CRLF:
p--;
return new TOKEN(t,ret);

ST_W_SPACE:
return new TOKEN(t,ret);

ST_W_DIV:
p--;
return new TOKEN(t,ret);

ST_0:
c=buf[p++];
t=_N;
if(c==0) { goto ST_W_END;}
if(IsNum(c)) {ret+=c;goto ST_0;}
if(c==L'.') {ret+=c;goto ST_P;}
if(c==L'/') { goto ST_0_DIV;}
if(IsSpace(c)) { goto ST_W_SPACE;}
if(IsCrlf(c)) { goto ST_W_CRLF;}
if(c==L'\\') { goto ST_W_BS;}
if(c==L'/') { goto ST_W_DIV;}
else {ret=L"error at ST_0";goto ST_ERR;}

ST_0_DIV:
p--;
return new TOKEN(t,ret);

ST_MINUS:
c=buf[p++];
if(c==0) {ret=L"error at ST_MINUS";goto ST_ERR;}
if(IsNum(c)) {ret+=c;goto ST_0;}
else {ret=L"error at ST_MINUS";goto ST_ERR;}

ST_P:
c=buf[p++];
if(c==0) {ret=L"error at ST_P";goto ST_ERR;}
if(IsNum(c)) {ret+=c;goto ST_P2;}
else {ret=L"";goto ST_ERR;}

ST_P2:
c=buf[p++];
t=_F;
if(c==0) { goto ST_W_END;}
if(IsNum(c)) {ret+=c;goto ST_P2;}
if(c=='/') { goto ST_0_DIV;}
if(IsSpace(c)) { goto ST_W_SPACE;}
if(IsCrlf(c)) { goto ST_W_CRLF;}
if(c==L'\\') { goto ST_W_BS;}
if(c==L'/') { goto ST_W_DIV;}
else {ret=L"error at ST_P2";goto ST_ERR;}

ST_END:
t=_E;
return new TOKEN(t,ret);

ST_W_END:
p--;
return new TOKEN(t,ret);

ST_ERR:
p--;
t=_X;
return new TOKEN(t,ret);

}

////////////////////////////////////////////////////////////////////////////////

// 由于解析阶段已经检查过语法,所以可以确保CStr型的ARG信息总是正确的

typedef struct _ARG
{
UByte * count;
CStr * parts;
}ARG;

typedef struct _LINE
{
CStr type;
UInt16 count;
ARG * args;
}LINE;

} // end of n.s. obj

////////////////////////////////////////////////////////////////////////////////

using namespace obj;

void COBJDlg::OnbtPhaseWord()
{
OBJ obj;
obj.pos=0;

CString tmp;
GetDlgItemText(txObj,tmp);

obj.text=CStr(tmp.GetBuffer(0),936);

SList<TOKEN *> list;

CStr op;

while(true)
{
TOKEN *ret=NextToken(&obj);
if(CStr(_X)==ret->type)goto Error;
list.Add(ret);
if(CStr(_E)==ret->type)
{
op+=L"(0,0)";
break;
}
else if(CStr(_R)==ret->type)
{
op+=L"(r,r)";
}
else
{
op+=L"("; op+=ret->type; op+=L","; op+=ret->val; op+=L")";
}
}

CDialog::SetDlgItemText(txWord,TmpCharArrayA(op));

return;
Error:
CDialog::SetDlgItemText(txWord,TmpCharArrayA(list.Get(list.Count()-1)->val));
}

instemast · 发表于 2008-4-5 15:07:00

无关紧要的细节说明：
我把回车/换行符作为一个单词读取，表示一句的结束（注释后的回车换行将被忽略）
此外在语义分析时也允许出现空白句子。。。（实际上注释后的回车换行也可以不忽略）

3DS MAX 导出的OBJ文件的行结尾是一个换行符，而不是回车加换行。

虽然我忽略了注释后的回车换行，但我仍然发现，截图中有多余的空行（不过不影响）
原因是，我是从UltraEdit中粘贴过来的，行结尾变成了回车加换行，所以省略了一个还有一个。

不过正式使用的时候，会直接使用3dsmax导出的文件，不会遇到多余的空行~~

instemast · 发表于 2008-4-5 20:07:00

总的来说，OBJ格式似乎很简单，但是只有按照《编译原理》来编码，才会获得较高性能。

此外，我支持unicode，以及任意ansi代码页，乱码是不存在的~~

发现了一个可以说是小bug：
空格之后的“\”（转行）会报错。
原因是"\"被我放在中英数状态后面处理了，而初态(ST_S)没有考虑它。
当一个单词之后出现空格时，这个单词便结束了，空格后面的"\"在本次没有被处理。
下次重新从初态开始时，发现有一个"\"便报错。

简单修正：
中英数单词之后的"\"将仅仅被认为是单词结束，并且退回这个"\"。
就是说，仅仅在初态ST_S中，才会真正处理"\"。
"\"之后只可以出现任意多个回车换行，并且回车换行会被忽略掉。

另外，简单起见，只有"\"之后出现的回车换行才会被一次性过滤，
即"\"之后不可能有空语句的出现。(否则"\"就失去意义了，因为语句被截断)
这是为了方便用户在记事本里编写OBJ文件。
其他情况下，有几个回车换行就有几个语句，允许出现多个空语句(没有任何影响)

实际上，我为什么要支持"\"呢？？？3ds max导出的文件不可能有转行的。
但是OBJ规范要求必须支持"\"。此外为了简化代码，我放宽了限制：
"\"之后紧接着可以出现空白，否则我要累死了，为了支持这种几乎没有用的功能。

instemast · 发表于 2008-4-7 21:09:00

草稿纸扫描如下：

月之灵 · 发表于 2008-4-8 00:28:00

这图纸强!!!

instemast · 发表于 2008-4-8 16:21:00

可编译源代码：

wxhwhmanshan · 发表于 2008-4-9 22:14:00

iEpsilonMeteOra · 发表于 2008-4-10 11:28:00

还有蝌蚪文...地说，LZ是赴日工作的？

instemast · 发表于 2008-4-10 15:55:00

iEpsilonMeteOra: Re:OBJ模型格式解析 (决不是硬编码)

还有蝌蚪文...地说，LZ是赴日工作的？

不是，我个人习惯用ja
还有一个好处就是避免被周围人看出来自己在干什么。

congy · 发表于 2008-4-11 04:22:00

instemast: Re: Re:OBJ模型格式解析 (决不是硬编码)

不是，我个人习惯用ja
还有一个好处就是避免被周围人看出来自己在干什么。

还有人有这个习惯....

账号		自动登录	找回密码
密码			立即注册

OBJ模型格式解析 (决不是硬编码)

Re:OBJ模型格式解析 (决不是硬编码)

Re:OBJ模型格式解析 (决不是硬编码)

Re: OBJ模型格式解析 (决不是硬编码)

Re:OBJ模型格式解析 (决不是硬编码)

Re: OBJ模型格式解析 (决不是硬编码)

Re:OBJ模型格式解析 (决不是硬编码)

Re:OBJ模型格式解析 (决不是硬编码)

Re: Re:OBJ模型格式解析 (决不是硬编码)

Re: Re: Re:OBJ模型格式解析 (决不是硬编码)