java 实现Lucene基于web的webLucene小记 3
build成功之后
我个人感觉 weblucene下除了webapp和dump目录以外
其他的文件没有用了
这点和车东的文档有些冲突
姑且先当我的感觉是对的吧,失败的话再回来看看
现在把weblucene/webapp 下的所有文件 复制一分到我的虚拟站点的目录
cp -R ./webapp /html/taoer_net/search/
然后进入站点目录
现在看到的都是原来目录中webapp里面的东西了
然后进入WEB-INF/classes
可以看到 IndexRunner.class 和 SearchRunner.class 这两个文件
对的
这两个就是待会咱们需要测试的文件
现在现在这个目录下编辑一个
java IndexRunner -i /html/taoer_net/search/dump/blog.xml -o /html/taoer_net/search/WEB-INF/var/blog
先报告错误:
Sun Jul 10 10:58:29 GMT-08:00 2005 Input is: /html/taoer_net/search/dump/blog.xml
1 [main] INFO IndexRunner – read source from /html/taoer_net/search/dump/blog.xml
Lucene index will be rebuild to /html/taoer_net/search/WEB-INF/var/blog/index
277 [main] ERROR com.chedong.weblucene.index.SAXIndexer – Failed with I/O error: Invalid byte 1 of 1-byte UTF-8 sequence.
298 [main] ERROR IndexRunner – Faint! Indexing failed
不知道是什么错误
另外
程序生成的xml文件应该是GB2312编码的
否则会
291 [main] ERROR com.chedong.weblucene.index.SAXIndexer – Failed with I/O error: Invalid byte 2 of 2-byte UTF-8 sequence.
314 [main] ERROR IndexRunner – Faint! Indexing failed
报告这样的错误
后来,我把blog.xml精简了很多很多
再测试,就ok了
显示
Sun Jul 10 11:03:44 GMT-08:00 2005 Input is: /html/taoer_net/search/dump/blog.xml
0 [main] INFO IndexRunner – read source from /html/taoer_net/search/dump/blog.xml
Lucene index will be rebuild to /html/taoer_net/search/WEB-INF/var/blog/index
2 rows added Total time Use:0 second
292 [main] INFO IndexRunner – Great! Indexing OK
但是车东的文档里面说显示:
Congratulations! You’ve indexed the source xml successfully!
就代表成功了
我想应该是一样的吧?
然后是测试检索
java SearchRunner -i /html/taoer_net/search/WEB-INF/var/blog/index -f “FullIndex” -k “as”
不知道为什么
不管搜索什么
总是搜索不到
返回
the original Searching for:
— find 0
先不管这个
程序没有报错
明天继续
明天下班打算研究
目录的结构和基于web应用方法
我的简介: 谁说tmd巨蟹座傻来的?我就是tmd巨蟹里边儿最聪明的!!!
数据源的XML非法字符的问题:Invalid byte 1 of 1-byte UTF-8 sequence
最近看到有人在用 WebLucene 非常惭愧,gRaSS.org.cn自己的FEED都因为XML字符问题已经有1个月没有更新了……原因还是PHP导出XML的时候,数据源中有非法XML字符的问题: 4018700 [main] ERROR com.chedong.webl…
淘宝认证已经下来了,你看看怎么在淘宝里嵌网页
涛,网店的事我正在申请认证,这两天我会跟李京爽联系一下,一旦认证下来我就把店先开起来,其中有一份,我和建商量完了,提前跟你说一声,有什么问题给我打电话或留言都行。
呵呵
兄弟谢谢你
等我忙过这阵子,把辉子和裤头叫上
一起聚聚
最近很好吧,看你工作挺带劲的。努力吧!
兰儿,你好:
不要这么客气,我也是初学,咱们可以一起学习进步.
因为这两周公司要求做SyncML的同步程序,
所以lucene就停滞下来了,不过SyncML下周应该就可以完成了,就可以继续研究lucene了,希望有机会一起研究,你可以加我msn:supertaoer@hotmail.com
不过一般只有下午6:30后才会上,公司不让使用qq和msn的.
祝你快乐
您好!
最近我也在做关于lucene的项目,您的weblucene做的如何了?希望有机会跟您交流一下。我是初学,请别见笑,真心希望能得到您的指点和帮助。