UPDATE2:感谢“据说要有”的建议,已修改脚本。
UPDATE1:脚本在异常退出(比如收到KILL信号,系统断电等)后再次运行时会有严重的BUG,导致用户词库丢失。现已修正,强烈推荐各位使用者更新。如果已经有过异常退出的用户,请退出脚本后至~/.sunpinyin/目录下检查(ls -l
),若userdict为符号链接,请删除之,sunpinyin将重建新的用户词库。对因此造成的数据损失表示抱歉。
之前在一篇文章里,我提到了在Ubuntu下使用fcitx + sunpinyin配合hubertstar的大词库实现媲美搜狗的流畅输入,但是仍然有一个大问题——当词库过大的时候输入中会出现停顿现象,严重影响用户体验(因此我当时也只推荐使用small版词库)。
这是因为fcitx和sunpinyin的词库都是使用SQLITE,在输入时需要反复查询,由于词库的特殊性(前后两个查询的词经常离得很远),SQLITE的缓存机制很难起效,因而只能反复读硬盘,导致速度很慢。
不过,在大宝的启发下,我参考了Ubuntu中文论坛里hubertstar的帖子,以及大宝的博客,我写了一个供Ubuntu使用的sunpinyin加速脚本,效果非常不错,拿上来和大家分享。
原理非常暴力——直接将整个sunpinyin的userdict放入/dev/shm(即存在于内存中的tmpfs),然后符号链接回来,相当于手动暴力cache整个词库,大幅提高了速度。这样做法的缺点就是内存消耗较大——我现在使用的大词库有100+MB,即需要100+MB的内存,不过,当下基本每个人都有2G+的内存,本来也就很难用完,这样正好提高了内存的利用率。
使用方式:将这个脚本放在方便的地方,通过chmod +x赋予可执行权利,在“系统 -> 首选项 -> 启动应用程序”中添加这个脚本。
相比于hubertstar和大宝的脚本,这个脚本有如下优点:
- 使用方便,只需要在GNOME会话登陆后自动运行即可;
- 自动将用户词库变更备份回原目录,不会导致自造词丢失;
- 卸载方便,脚本在退出时(包括关机或登出)会自动恢复用户词库,因而如果没有启动这个脚本也不影响运行sunpinyin;
- 完全运行在用户空间,不需要使用服务或者cron。
#!/bin/bash #sunpinyin_speed_up.sh # Sunpinyin Speed Up Script for Ubuntu (by memory caching, and no data loss) # You can run this script in background on GNOME logging in. # Originally written Hubert Star, modified by Bob Robot (http://robotshell.org/). # Capture the exit signal, make sure it is the FIRST uncommented line. trap "do_exit" SIGHUP SIGINT SIGQUIT SIGTERM SUN_DIR="${HOME}/.sunpinyin" SHM_USERDICT="/dev/shm/sunpinyin_userdict.sh0" # Backup the userdict and restore all changes made by this script on exit. do_exit() { cp -f "${SHM_USERDICT}" "${SUN_DIR}/userdict.real" rm -f "${SHM_USERDICT}" mv -f "${SUN_DIR}/userdict.real" "${SUN_DIR}/userdict" exit 0 } # Work around for abnormal quit. if [ -e "${SUN_DIR}/userdict.real" ] then rm -f "${SHM_USERDICT}" mv -f "${SUN_DIR}/userdict.real" "${SUN_DIR}/userdict" fi # Rename the real userdict, copy it to RAM and make a symblic link back. # From now on the modification and query on userdict takes place in RAM. mv -f "${SUN_DIR}/userdict" "${SUN_DIR}/userdict.real" cp -f "${SUN_DIR}/userdict.real" "${SHM_USERDICT}" ln -sf "${SHM_USERDICT}" "${SUN_DIR}/userdict" # Automatically backup the userdict, make sure not losing the modification. p_count=0 while [ true ] do p_count=$(($p_count+1)) sleep 1800 if [ $p_count == 4 ] then p_count=0 cp -f "${SHM_USERDICT}" "${SUN_DIR}/userdict.real" fi p_size_shm=$(ls -l "${SHM_USERDICT}" | awk '{print $5}') p_size_real_t=$(ls -l "${SUN_DIR}/userdict.real" | awk '{print $5}') p_size_real=$(($p_size_real_t+512)) if [ $p_size_shm -ge $p_size_real ] then cp -f "${SHM_USERDICT}" "${SUN_DIR}/userdict.real" fi done
经测试,不论多大的词库(只要你内存无压力)都可以顺畅输入。赶紧把你的sunpinyin词库换成超大词库,来体验更流畅的Ubuntu拼音输入吧~
Comments ( 27 )