您的位置: blog.railschina.com >> TAG: 资料库
日志(8)
该TAG下暂无资讯
-
[转载]URI和URL的区别
思维艺术 发表于 2007-08-02 15:09:53
链接:http://www.yuanma.org/data/2006/0824/article_1405.htm1.什么是URIWeb上可用的每种资源 - HTML文档、图像、视频片段、程序等 - 由一个通过通用资源标志符(Universal Resource Identifier, 简称"URI")进行定位。...
-
(转载)信息采集软件采用的正则表达式
思维艺术 发表于 2007-08-01 16:53:46
链接:http://cyber2005.bokee.com/5960017.html  ...
-
ruby中使用正则表达式时"\"的影响
思维艺术 发表于 2007-07-31 18:30:41
注:在某些浏览器或环境中\会显示成¥。 sub(gsub, sub!, gsub!)的参数 不要把字符串传给第一参数 因为一旦把字符串传给第一参数的话,就会依次进行下列处理过程 对字符串的元字符进行解释(编译脚本时) 运行sub, gsub时,...
-
(转载)常用的正则表达式
思维艺术 发表于 2007-07-31 16:30:57
正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(...
-
Web Spider的一些资料
思维艺术 发表于 2007-07-30 16:15:07
转载:http://blog.joycode.com/uestc95/archive/2004/09/27/34582.aspx?Pending=true 最近要开始Web Spider的开发工作,陆续收集了一些资料,分享一下,等Spider开发完毕后再将开发心得整理一下。  ...
-
一个蜘蛛程序
思维艺术 发表于 2007-07-30 15:16:34
转载:http://www.highya.com/viewthread.php?tid=6350标题:一个蜘蛛程序实现网页抓取和存储(搜索引擎实现原理) PHP实现 在论坛里看到有人发了爬虫程序,无意中想到我很久前也写过一个,找了找硬盘中的...
-
Spider技术:设计Spider时要解决的几个问题
思维艺术 发表于 2007-07-30 13:38:45
作者:渡渡鸟工作室 http://hi.baidu.com/dudubirdstudio (版权所有,转载须注明出处) spider是整个搜索引擎系统中很重要的一个组成部分,可以说是搜索引擎的基础。它不仅仅是为搜索引擎提供了搜索对象——海量数...
-
Programming a Spider in Java
思维艺术 发表于 2007-07-30 11:23:29
Introduction Spiders are programs that can visit Web sites and follow hyperlinks. By using a spider, you can quickly map out all of the pages contained on a Web site. This article will show you how to...
该TAG下暂无图片
该TAG下暂无商品
该TAG下暂无软件
该TAG下暂无书签
该TAG下暂无影音
