|
发表于 2004-2-14 20:01:00
|
显示全部楼层
Re: Re:大家帮看下我这个demo的桢数。
kypck: Re:大家帮看下我这个demo的桢数。
在P4CPU上运行的mandelbrot程序使用了icc,在AMD CPU上运行的程序首先只是使用VC的编译器,速度稍微比P4快,...
令我不太理解的是既然是大部分是double,那么用ICC的P3优化(使用SSE,K7XP也支持这个吧)应该不会造成多少向量化的结果才对,也就是说不应该出现大幅度的性能提升才对啊……不理解中,我曾经编译过一个类似super pi的程序,使用的是Chudnovsky级数算法,使用的是ICC8进行编译,在计算1M位的时候,如果不使用任何优化,则我的电脑是28秒左右,同时B2500+是25妙左右,当完全优化后,我的电脑可以到20s左右,而B2500+依然在24s左右。
至于专业3D应用,基本上像spec这类测试完全是Intel的天下……
哎……扯远了,接着说这个程序吧。如果你使用DX,可以常识使用SoftVertexProcessing的VS进行skin,同时使用multistream以减轻AGP总线的压力,看看效果如何,DX中的VVM(虚拟顶点处理器)应该说是相当不错的。
我依旧认为是CPU制约了程序的速度,运行该程序时,cpu是时刻处于100%状态的。 |
|