游戏开发论坛

 找回密码
 立即注册
搜索
12
返回列表 发新帖
楼主: kypck

大家帮看下我这个demo的桢数。

[复制链接]

3

主题

56

帖子

56

积分

注册会员

Rank: 2

积分
56
发表于 2004-2-15 11:10:00 | 显示全部楼层

Re:大家帮看下我这个demo的桢数。

不太理解你的观点,既然已经是CPU bounded。那么改用SWVP只会更加重CPU的负担。

另,如果感觉是AGP bandwidth限制的话,可以尝试采用压缩的顶点格式,比如把Normal压缩到32bit,texcoord也可以用两个8bit来表示。

我在gf4-4200 xp-sp1下测试是37帧,帧速很稳定。

6

主题

444

帖子

457

积分

中级会员

Rank: 3Rank: 3

积分
457
发表于 2004-2-15 11:20:00 | 显示全部楼层

Re: Re:大家帮看下我这个demo的桢数。

chenlee: Re:大家帮看下我这个demo的桢数。

不太理解你的观点,既然已经是CPU bounded。那么改用SWVP只会更加重CPU的负担。

另,如果感觉是AGP band...

你没有理解我的意思。
楼主这个程序原来的skin就是由CPU来完成的,所以使用SWVP不一定会进一步增加cpu的负担,因为D3D中的SWVP对各个CPU的优化工作做得比较好。
楼主坚持是AGP bandwidth的问题,所以我建议楼主使用multistream的方法减轻AGP带宽的压力试验一下。

8

主题

553

帖子

560

积分

高级会员

Rank: 4

积分
560
 楼主| 发表于 2004-2-15 15:31:00 | 显示全部楼层

Re: 大家帮看下我这个demo的桢数。

看看这个几个版本的执行文件就没什么好说的了。
一个是无法线的(使用cl编译),一个是short法线并为p4优化(使用icc编译),还有一个是short法线并为p3优化(使用icc编译)
第一个程序几乎比原来快一倍的速度足够说明问题了。

sf_2004215153130.rar

183.41 KB, 下载次数:

8

主题

553

帖子

560

积分

高级会员

Rank: 4

积分
560
 楼主| 发表于 2004-2-15 15:32:00 | 显示全部楼层

Re:大家帮看下我这个demo的桢数。

别忘了把解压后的文件放到原来程序的目录中去啊

6

主题

444

帖子

457

积分

中级会员

Rank: 3Rank: 3

积分
457
发表于 2004-2-15 15:53:00 | 显示全部楼层

Re: Re: 大家帮看下我这个demo的桢数。

kypck: Re: 大家帮看下我这个demo的桢数。

看看这个几个版本的执行文件就没什么好说的了。
一个是无法线的(使用cl编译),一个是short法线并为p4优化...

P3优化和p4优化的基本没有fps差别,说明针对float,SSE2没有起到额外的作用。
至于无法线的那个,恕小人愚钝,愚以为是减少了计算量才是fps增加的根本。

8

主题

284

帖子

296

积分

中级会员

Rank: 3Rank: 3

积分
296
QQ
发表于 2004-2-15 16:08:00 | 显示全部楼层

Re:大家帮看下我这个demo的桢数。

XP2500+

GF4 TI4200

开一个,平均六十帧。开两个平均三十帧。

8

主题

553

帖子

560

积分

高级会员

Rank: 4

积分
560
 楼主| 发表于 2004-2-15 22:03:00 | 显示全部楼层

Re:大家帮看下我这个demo的桢数。

to hourousha:
嘿嘿,我当然让CPU“白”计算了法线,我想编译器应该不会把这个优化掉吧?其实我做的工作就是把glEnableClientState(GL_NORMA_ARRAY)这行给注释掉了。
再说使用short法线,由于需要把float影射到short上去,需要额外的计算量并且在由于数据没有对齐,所以CPU执行速度多少会有影响,为什么速度不减反增?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

作品发布|文章投稿|广告合作|关于本站|游戏开发论坛 ( 闽ICP备17032699号-3 )

GMT+8, 2025-2-25 06:05

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表