向量 Vector 的空间
保福寺研究僧
显示标签为“
互联网
”的博文。
显示所有博文
显示标签为“
互联网
”的博文。
显示所有博文
2007-04-22
python 爬虫
我把上次写得python的爬虫写得更快了。使用了多线程,可以同时爬5个网站。同时用了配置文件,在配置爬虫的时候只需要修改配置文件就可以了。
下面是配置文件的样子,现在1个小时可以爬10000个网页,和C++的爬虫相比还是很慢,但是对于小的搜索引擎是足够了,嘿嘿。
我现在将berkeley db加入到系统中,基本上已经是一个小型的引擎了。
python与berkeleyDB的接口是bsddb,关于它的讨论可以从Google上获得。
2007-01-29
互联网创业什么要注意什么?
转载自
http://www.douban.com/group/topic/1410869
2006年是youtube被收购,结果中国出来200多个tube。现在一些还在做吧,出来了一个flickr,结果中国也出来一堆xlickr。相信其中一些能够做好,但不是每一家公司。
互联网创业的诱惑在于:是个人就可以开始做,危险在于:竞争太强,因为谁都可以做,残酷在于:市场上只有第一,也许有第二,基本上没有第三第四。所以,在互联网上创业,需要注意几点:
注意大个子,如果微软或Google想做这件事情,那你要认真考虑还做不做;
注意自己的局部优势,要是在自己的一亩三分地还没有优势,那就要考虑自己对准的市场是不是太大?
注意自己的市场,是不是没有成长潜力,要是是一个萎缩中的市场,你当然要考虑了;
注意自己产品的可用性和价值,没有这个,什么都不用说了;
注意自己的竞争策略,为什么自己能够在竞争中存在下去?什么?没有竞争?那再想想看自己的妙主意真得有市场吗?为什么全世界都没有想到,答案很可能是:那根本不是好主意。
较旧的博文
主页
查看移动版本
订阅:
博文 (Atom)
我的简介
xlvector
中关村, 北京, China
查看我的完整个人资料
FeedBurner FeedCount
关注者
xlvector 的共享
我的Twitter
Twitter Updates
follow me on Twitter
我的研究兴趣
2009 协同过滤:SVD分解
2009 协同过滤 collaborative filtering
2008 网络的采样 Graph Sampling
2008 网络的特征值分析 Graph Spectral
2008 网络中的随机游走 Random Walk
2008 网络中的相似性度量 Node Similarity
2008 网络中的排名 Graph Ranking
2008 网络中匹配 Graph Matching
2008 复杂网络
2007 汉语分词
2007 文本分类聚类
2007 文本中潜语义关系的挖掘
2007 搜索引擎系统
2006 运动检测
2006 人脸检测
2006 3D渐进网格和网格简化
博客归档
▼
2024
(2)
▼
三月
(1)
Collaboration request
►
一月
(1)
►
2022
(6)
►
十二月
(1)
►
七月
(1)
►
五月
(1)
►
四月
(1)
►
三月
(1)
►
二月
(1)
►
2021
(18)
►
十月
(1)
►
九月
(2)
►
七月
(2)
►
六月
(1)
►
五月
(1)
►
四月
(2)
►
三月
(3)
►
二月
(2)
►
一月
(4)
►
2020
(22)
►
十二月
(5)
►
十一月
(3)
►
十月
(3)
►
九月
(3)
►
八月
(6)
►
七月
(2)
►
2018
(1)
►
七月
(1)
►
2016
(1)
►
四月
(1)
►
2015
(4)
►
八月
(1)
►
六月
(1)
►
五月
(1)
►
一月
(1)
►
2014
(27)
►
八月
(2)
►
七月
(4)
►
六月
(2)
►
五月
(3)
►
四月
(4)
►
三月
(6)
►
二月
(2)
►
一月
(4)
►
2013
(40)
►
十二月
(1)
►
十月
(2)
►
八月
(1)
►
七月
(15)
►
六月
(6)
►
五月
(3)
►
四月
(3)
►
三月
(9)
►
2012
(1)
►
十一月
(1)
►
2009
(59)
►
九月
(14)
►
八月
(16)
►
七月
(6)
►
五月
(1)
►
四月
(6)
►
三月
(4)
►
二月
(5)
►
一月
(7)
►
2008
(20)
►
十二月
(3)
►
十一月
(1)
►
十月
(7)
►
九月
(2)
►
八月
(1)
►
五月
(3)
►
四月
(1)
►
二月
(1)
►
一月
(1)
►
2007
(56)
►
十月
(2)
►
九月
(7)
►
八月
(1)
►
六月
(5)
►
五月
(9)
►
四月
(6)
►
三月
(6)
►
二月
(3)
►
一月
(17)
►
2006
(30)
►
十二月
(14)
►
十月
(9)
►
九月
(1)
►
八月
(6)
我的母校
中国科学技术大学
中科院自动化所
标签
graph
推荐系统
cindoo
html
netflixprize
recommendation system
search
collaborative filtering
废话
汉字
C++
javascript
互联网
可视化
数据库
日志系统
模式识别
社会网络
编码
WWW2007
book
cluster
crawler
dom
github
googlereader
pagerank
python
recommend
search,web
创业
单件
图书
图像
文本表示
时间
矩阵
解析
论文
设计模式
输入法
过滤
友情链接
响马大日报
孔庆东
Jane的小小小小屋
三联生活周刊
当年明月的blog
河蟹娱乐
掘图志
时代杂志中文版
ReadWriteWeb
科学松鼠会
方舟子的blog
麦田蚂蚁