释放CUDA的威力——Badaboom视频转换试用手记

忍痛割舍了过去长期钟爱的ATI,选择了nVidia显卡,不是因为PhysX技术带来的游戏效能,而是看中了在非游戏应用中前景广阔的CUDA!

作为展示CUDA在非游戏领域实用价值的代表作,Badaboom以惊人的视频转换速度,被各大媒体广为传颂。对于这样一款富有传奇色彩的软件,我自然要亲自品鉴一番了。

Badaboom在前不久刚刚发布了正式的1.0版本,相比此前Beta4实在看不出有什么改进。支持的输入视频格式仍然很少,不支持最流行的mkv封装格式和Xvid视频编码是Badaboom最大的硬伤。好在借助tsMuxeR转换一下封装格式(mkv -> ts)倒也能让Badaboom接受大部分H.264的视频。

继续阅读释放CUDA的威力——Badaboom视频转换试用手记

移植微星显卡增强功能至最新nVidia驱动

微星显卡在nVidia显卡驱动的基础上提供了一些专有的增强功能(如D.O.T.和Vivid),但官方发布的版本是基于较老版本的nVidia显卡驱动制作的。如果希望使用nVidia的最新驱动,但又不愿失去微星的增强功能的话,就需要自己做一个移植工作了。

首先是准备工作。从微星网站下载的显卡驱动中提取出以下四个文件:

MsiCpl.dll
Startup.exe
nv_disp.inf
nvdisp.nvu

然后再从nVidia官方网站上下载最新版本的显卡驱动。因为下载的.exe安装文件其实是一个自解压包,可以使用WinRAR等工具展开;或者直接运行,在经过解压缩的步骤后推出安装程序。

下面开始实施移植。将上述从微星驱动中提取出的前两个文件MsiCpl.dll和Startup.exe直接复制到展开后的最新版nVidia驱动程序文件夹中。另外两个文件nv_disp.inf和nvdisp.nvu都需要手工与nVidia驱动程序的对应文件进行合并,将微星加入的部分同步到nVidia的驱动中。

以下是我针对nVidia的178.13 Vista 64bit International WHQL驱动版本修改好的上述后两个文件,仅供参考:

17813_geforce_winvista_64bit_international_whql(msi)

nVidia显卡驱动与Hyper-V存在冲突

在折腾了数天后,终于查出导致Windows 2008系统出现性能问题的罪魁祸首。话说前几日在新系统上安装Windows Server 2008后,在诸多场合下出现了显著的响应变慢,甚至长时间停滞的问题,例如最大化窗口需要3-5秒时间、初始化3D显示时约有5秒以上的延迟,打开视频文件则伴随长达半分钟左右的停滞……

最终,经过反复重装系统、安装/卸载软件的折磨,终于发现问题出在nVidia的显卡驱动程序与Hyper-V有冲突。只要卸载掉两者中任一,上述症状就全部消失了。在Hyper-V的技术论坛中找到了类似的问题反馈,而且有人证实ATI的显卡驱动没有问题,甚至有比我还有受虐倾向的强人,测试了过去18个月以来nVidia所发布的驱动程序,直到找到v100版本据说没有上述问题…… 发帖人在向微软提交bug后也得到了技术人员对此问题的确认,可惜目前暂无解决措施。

唉,本就冲着Hyper-V才安装Windows 2008,现在倒成了近在眼前美味的吃不到…… 亏得我放弃了多年的合作伙伴ATI而选择nVidia的显卡,结果竟遭遇如此折磨!

我“芯”未老

在最近HDTV/HDRip汹涌大潮的席卷下,我的旧电脑已倍感不支。一遇到高码率的H.264电影,音画异步的状况常常是惨不忍睹。好在当年攒这台电脑时亦预见到了今日可能面临的困境,潜藏在CPU深处的那股超频异禀也终于盼到了大展宏图的这一天。

当初刚买这台电脑时,为了不致辱没我“超频狂人”的称号,虽需求并不强烈,但也小超了一点。Athlon 64 2800+的CPU在225的外频下一跑就是两年。千里伏骥,唯仰天嘶鸣,实在委屈它了……

华硕K8N 这块主板虽然在超频界并不被看好,但既然到了我的手中,那也绝非池中之物。三压分调、外频双锁,再加上过频保护的金钟罩,上手的分量可谓恰到好处。

闲话不多说,直接来看超频的成果吧:

3850+ (275 x 9, DDR333 @ 458 & 1T, HT 3x @ 825) 稳定
3920+ (280 x 9 @ 1.6V, DDR333 @ 466 & 1T, HT 3x @ 840) 稳定
4060+ (290 x 9 @ 1.6V, DDR333 @ 482 & 1T, HT 3x @ 870) 进入WinXP,播放H.264片刻后死机
4100+ (295 x 9 @ 1.6V, DDR333 @ 491 & 1T, HT 3x @ 885) 能点亮,但无法进入WinXP

上述实验充分展现了这块Athlon64的超频潜力,总算不枉当年花的大价钱了。在电压方面,我还是比较怜惜,只加了0.05V,毕竟夏天的脚步已悄然临近了;另一方面,本着追求性能平衡的理念,我没有打算通过牺牲内存和HT的频率来换取CPU“一枝独秀”。

最终,经过几天时间的考验,锁定“3920+”为最佳的稳定频率,基本实现了绝大多数码率的H.264正常播放。:)

不过问题也随之而来了,首先是发热量,以往通过“Cool&Quiet”的调控,CPU风扇几乎未曾全速运转过,但现在只要CPU稍显繁忙就会听到风扇匆匆提速的脚步声;与此同时,能耗明显增加,特别是夜间下载的时候,颇为浪费。

于是,寻找一条平衡性能与能耗的道路就显得非常迫切了,浮现在我脑海中第一个念头就是“软超频” —— 一个曾经叱诧风云却渐已被人淡忘的名词。以往,“频随芯动”的境界只有在AMD或Intel施展独门秘传的绝技时才能有幸得见,但借助“软超频”,我们已然可以任意驾驭这种上乘心法,在泰山压顶时施展出雄浑内力,在凌波微步间轻扬起拂柳之袖。

下面就祭出我所使用过的传说中软超频的“七种武器”,挨个掂量掂量。

nVidia nTune
师出武林正宗,可惜学艺不精,眼高手低。
在调节HT-multiplier,调节CPU外频或AGP频率时常常死机。

A64Tweaker 0.31/0.6beta
无师自通的武学天才,精通内存调教之术。可惜中道颓丧,缺乏应变乏术。
完全没有正确识别出nForce3 Pro的内存参数来。

A64Info
与A64Tweaker有着极深的渊源,武艺一脉相承,青出于蓝而甚于蓝。
最求极致的性能是他的拿手好戏,可调节的内存参数让人眼花缭乱。

ClockGen 1.0.5.3
系出名门,秉承师门戒律,只修行纯正内功,不屑于旁门左道。
仅限调节CPU外频、AGP频率。

ClockGen for nVidia nForce3 1.04
与ClockGen为同门师兄弟,但学艺泛而不精。
功能部分有效,可调节FID、调节VID无效、调节CPU外频或AGP频率时死机。

ATI Tool
ATI显卡的软超频工具,地位无可动摇。与CPU软超频堪称“双剑合璧”!

HoeKey
这不是那个小巧强悍的热键工具么?没错!它的“指点”,再加上ClockGen for nForce3,那才真正发挥出了软超频的精髓!正所谓“笑看风云,尽在弹指一挥间!”。