My studying notes for Java,Ruby,Ajax and other any interesting things.

星期二, 十二月 04, 2007

堆排序的算法

堆排序在最坏的情况下,其时间复杂度也能达到O(nlogn)。相对于快速排序来说,
这是它最大的优点,此外,堆排序仅需要一个记录大小供交换用的辅助存储空间。
堆排序的数据结构是二叉堆,二叉堆的特点有两个,一个是它是一棵完全二叉树,
另一个是它的根结点小于孩子结点,所以我们很容易找到它的最小结点----根结点;当然
如果你想找到最大结点的话,那就要扫描所有的叶子结点,这是很费时间的,如果你想找的
是最大结点的话,你最好把它弄成一个大顶堆,即一棵根结点大于孩子结点的完全二叉树。
二叉堆通常用数组来实现,它舍弃下标0,从下标1开始置数,则很容易满足,对于数组
中任意位置i上的元素,其左儿子的位置在2i上,右儿子的位置在2i+1上,双亲的位置则在
i/2上。
堆排序的算法之一是把数组构建成二叉堆----这只要增添一个长度为n+1的辅助空间,
然后把原数组的元素依次插入到二叉堆即可。然后删除二叉堆的根,把它作为排序后的数组
的第一个元素,然后使二叉堆的长度减1,并通过上移使得新得到的序列仍为二叉堆,
再提取新二叉堆的第一个元素到新数组。依此类推,直到提取最后一个元素,
新得到的数组就是排序后的数组。
template
void Insert(T a[], int len, T x)//把x插入到原长度为len的二叉堆,注意保证新二叉堆不越界
{
int i;
for (i=len; i/2>0 && a[i/2]>x; i/=2)
a[i] = a[i/2];
a[i] = x;
}

template
T DeleteMin(T a[], int len)//删除二叉堆的根,并通过上移使得新得到的序列仍为二叉堆
{
if (len == 0)
exit(1);
T min = a[1];//二叉堆的根
T last = a[len--];//二叉堆的最后一个元素

int c;
int i;
for (i=1; i*2<=len; i=c)//把二叉堆的某些元素往前移,使得新得到的序列仍为二叉堆 { c = i * 2;//i的左儿子 if (c != len && a[c+1] <> a[c])//若i的小儿子小于二叉堆的最后一个元素,把其移到i的位置
a[i] = a[c];
else
break;
}
a[i] = last; //把二叉堆的最后一个元素放到适当的空位,此时得到的序列仍为二叉堆

return min;
}

template
void HeapSort(T a[], int len)
{
T *ca = new T[len+1]; //复制原数组到二叉堆
ca[0] = 0;
for (int i=0; i
Insert(ca, i+1, a[i]);

for (int i=0; i
{
a[i] = DeleteMin(ca, len-i);
}

a[len-1] = ca[1]; //注意不能忘了最后一个元素

delete []ca;
}
在《数据结构习题与解析》(李春葆 编著 清华大学出版社)中看到一个类似的算法,
它是把原数组构建成一个大顶堆,然后把大顶堆的第一个元素与最后一个元素交换;
再把前n-1个元素重新构造成一个大顶堆,把新大顶堆的第一个元素与最后一个元素交换;
依此类推,直到新大顶堆只有一个元素,这样就得到了一个有序的二叉堆。
算法如下:
template
void HeapSort(T a[], int len)
{
T *ca = new T[len+1];
ca[0] = 0;
for (int i=0; i
ca[i+1] = a[i];

for (int i=len/2; i>0; i--) //建立初始堆
HeapAdjust(ca, len, i);

for (int i=len; i>1; i--)//进行len-1次循环,完成堆排序
{
Swap(ca[1], ca[i]); //新大顶堆的第一个元素与最后一个元素交换
HeapAdjust(ca, i-1, 1);//筛a[1]元素,得到i-1个元素的堆
}

for (int i=0; i
a[i] = ca[i+1];

delete []ca;
}

template
void HeapAdjust(T a[], int len, int left) //将i与其小儿子交换位置
{
if (len == 0)
exit(1);

T x = a[left];
int i = left;
int c = 2 * i;
while (c <= len) { if (c <> a[c])//若i有右儿子,且右儿子大于左儿子,c指向右儿子
c++;
if (last < i =" c;" c =" 2" t =" a;" a =" b;" b =" t;" ca =" new" i="0;" i="len/2;">0; i--) //把原数组构建成一个大顶堆
HeapAdjust(ca, len, i);
Swap(ca[1], ca[len]); //把大顶堆的第一个元素与最后一个元素交换

for (int i=len-1; i>0; i--)
{
for (int j=i/2; j>0; j--)//遍历长度为i的堆,得到新的大顶堆
HeapAdjust(ca, i, j);
Swap(ca[1], ca[i]);
}

for (int i=0; i
a[i] = ca[i+1];

delete []ca;
}

template
void HeapAdjust(T a[], int len, int i) //将i与其小儿子交换位置
{
int c = 2 * i;

if (c < max =" (a[c]"> a[c+1])? a[c] : a[c+1];
if (a[i] < t =" a;" a =" b;" b =" t;" ca =" new" i="0;" i="len/2;">0; i--) //把原数组构建成一个大顶堆
HeapAdjust(ca, len, i);
a[0] = ca[1];
ca[1] = ca[len]; //把二叉堆的最后一个元素放到根的位置

for (int i=len-1; i>0; i--)
{
for (int j=i/2; j>0; j--)
HeapAdjust(ca, i, j);
a[len-i] = ca[1];
ca[1] = ca[i]; //把二叉堆的最后一个元素放到根的位置
}

delete []ca;
}

template
void HeapAdjust(T a[], int len, int i)
{
int c = 2 * i;

if (c < min =" (a[c]"> min)
Swap(a[i], min);
}
else
{
if (a[i] > a[c])
Swap(a[i], a[c]);
}
}

template
void Swap(T & a, T & b)
{
T t = a;
a = b;
b = t;
}
后面两种方法采用的是递归,容易理解,但时间复杂度较高,因为比前两种要慢上很多,
所以不可能是O(nlogn),估计是O(n^2),但具体我也不会算,请。

[fwd]搜索引擎学习资源收集

搜索引擎学习资源收集
一、搜索引擎技术/动态资源
<一>、综合类
1、卢亮的搜索引擎研究 http://www.wespoke.com/
卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://booso.com/),好像现在已经停止开发了,目前他服务于博客网。在他的这个blog上可以了解许多搜索引擎开发的技术和经验,值得持续关注。
2、laolu'blog
有不少来自国外的关于搜索引擎方面的资料,偏重于资料和数字
3、哈斯日志 http://www.loverty.org/
在这里可以看到国内外几大搜索引擎的最新动态,值得关注搜索发展形势的人多看看
4、北京奕天锐新科技有限公司 http://www.21cnbj.com/
搜索引擎、SEO、SEM等行业新闻动态
5、中文搜索引擎指南网 http://www.sowang.com/
搜索引擎最新动态,各种搜索技巧、方法
6、中文全文检索网 http://www.fullsearcher.com/
FullSearcher.Com是有两个对搜索爱好的年轻人创办,我们的目标是让中文互联网全面进入搜索时代,让搜索无处不在。通过搜索改变人们的生活。FullSearcher提供全文检索的相关知识、垂直搜索引擎知识、搜索的相关新闻等搜索相关内容。
7、周博——每天9点档的搜索引擎动态
8、李彦宏的博客 http://hi.baidu.com/liyanhong
9、中科院软件所- 张俊林博客 http://blog.csdn.net/malefactor/
搜索引擎技术研究
<二>、Google动态
Google官方博客:Google 黑板报 http://googlechinablog.com/
Google 中国的博客网志,走近我们的产品、技术和文化1、Gfans http://gfans.org/
2、G速客 http://www.gseeker.com/
<二>、其他搜索引擎动态
1、雅虎搜索日志 http://ysearchblog.cn/
记录雅虎搜索引擎的动态、产品、技术等
2、搜狗实验室 http://www.sogou.com/labs/
搜狗实验室(Sogou Labs)是搜狗搜索核心研发团队对外交流的窗口,包含创意产品、原型演示、资料下载、学术论文四个栏目。实验室热烈欢迎一直以来关注搜狗、支持搜狗的各位互联网玩家;对于致力于中文互联网研究的学术界同仁们的经常来访,也予以热切的期待。我们期望通过这个平台,展现搜狗研发团队强大的研发、创新能力;推动学术界和产业界的交互;了解用户对新产品的需求。我们的目标:为中文网民的互联网生活提供更加全面、更加优质的服务。
搜狗实验室博客 http://labs.blog.sohu.com/
3、百度的空间 http://hi.baidu.com/baidu
百度的动态
4、有道搜索博客 http://i.yodao.com/
网易新推搜索引擎--有道搜索的近期动态
5、Live Search's WebLog http://blogs.msdn.com/livesearch/
Microsoft Live Search's news http://windowslivebeta.spaces.live.com/
搜索引擎学习资源收集
一、搜索引擎技术/动态资源
<一>、综合类
1、卢亮的搜索引擎研究 http://www.wespoke.com/
卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://booso.com/),好像现在已经停止开发了,目前他服务于博客网。在他的这个blog上可以了解许多搜索引擎开发的技术和经验,值得持续关注。
2、laolu'blog
有不少来自国外的关于搜索引擎方面的资料,偏重于资料和数字
3、哈斯日志 http://www.loverty.org/
在这里可以看到国内外几大搜索引擎的最新动态,值得关注搜索发展形势的人多看看
4、北京奕天锐新科技有限公司 http://www.21cnbj.com/
搜索引擎、SEO、SEM等行业新闻动态
5、中文搜索引擎指南网 http://www.sowang.com/
搜索引擎最新动态,各种搜索技巧、方法
6、中文全文检索网 http://www.fullsearcher.com/
FullSearcher.Com是有两个对搜索爱好的年轻人创办,我们的目标是让中文互联网全面进入搜索时代,让搜索无处不在。通过搜索改变人们的生活。FullSearcher提供全文检索的相关知识、垂直搜索引擎知识、搜索的相关新闻等搜索相关内容。
7、周博——每天9点档的搜索引擎动态
8、李彦宏的博客 http://hi.baidu.com/liyanhong
9、中科院软件所- 张俊林博客 http://blog.csdn.net/malefactor/
搜索引擎技术研究
<二>、Google动态
Google官方博客:Google 黑板报 http://googlechinablog.com/
Google 中国的博客网志,走近我们的产品、技术和文化1、Gfans http://gfans.org/
2、G速客 http://www.gseeker.com/
<二>、其他搜索引擎动态
1、雅虎搜索日志 http://ysearchblog.cn/
记录雅虎搜索引擎的动态、产品、技术等
2、搜狗实验室 http://www.sogou.com/labs/
搜狗实验室(Sogou Labs)是搜狗搜索核心研发团队对外交流的窗口,包含创意产品、原型演示、资料下载、学术论文四个栏目。实验室热烈欢迎一直以来关注搜狗、支持搜狗的各位互联网玩家;对于致力于中文互联网研究的学术界同仁们的经常来访,也予以热切的期待。我们期望通过这个平台,展现搜狗研发团队强大的研发、创新能力;推动学术界和产业界的交互;了解用户对新产品的需求。我们的目标:为中文网民的互联网生活提供更加全面、更加优质的服务。
搜狗实验室博客 http://labs.blog.sohu.com/
3、百度的空间 http://hi.baidu.com/baidu
百度的动态
4、有道搜索博客 http://i.yodao.com/
网易新推搜索引擎--有道搜索的近期动态
5、Live Search's WebLog http://blogs.msdn.com/livesearch/
Microsoft Live Search's news http://windowslivebeta.spaces.live.com/

二、搜索引擎代码资源
一>、搜索引擎/网络蜘蛛程序代码
国外开发的相关程序
1、Nutch
官方网站 http://www.nutch.org/中文站点 http://www.nutchchina.com/最新版本:Nutch 0.7.2 Released
Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具,可以建立自己内部网的搜索引擎,也可以针对整个网络建立搜索引擎。自由(Free)而免费(Free)。
2、Lucene
官方网站 http://lucene.apache.org中文站点 http://www.lucene.com.cn/
Lucene 是apache软件基金会 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包[用Java写的],即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
3、Larbin: http://larbin.sourceforge.net/index-eng.html
larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人 Sébastien Ailleret独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。
国内开发的相关程序
1、SQLET - 开放源码的中文搜索引擎
官方网站 http://www.sqlet.com/
SQLET,是Search & Query &Link, 加后缀 let,表示小的,小型的意思.打算建立一个能搜上亿张网页的基于主题功能的中文搜索引擎.支持3种索引方式:MySql_table_Index, Lucene_Index,SQLET_Index.网页抓取可以保存在文件系统及数据库里。自带WebServer.
2、菲度垂直搜索引擎代码
菲度http://www.faydu.net 为一个垂直在线搜索的演示版,主要对国内一些购物站点进行搜索整理,
现在开源测试版本的代码,供大家讨论。下载说明:
1》因为本程序是在服务器上运行,是在多个处理器下运行的,个人电脑上请控制线程数量
2》包含一个data 的数据库 还原到sql server
3》收集完毕默认在bin目录有licene生成的反排的索引文件
4》下载地址:http://www.faydu.net/download/code.rar
开放日期:2006-4-18 来源:http://blog.csdn.net/faydu/archive/2006/04/18/667997.aspx语言:VB.net(c#)
二>、中文分词程序代码
1、计算所汉语词法分析系统 ICTCLAS
中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐马模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58%(最近的973专家组评测结果),基于角色标注的未登录词识别能取得高于90%召回率,其中中国人名的识别召回率接近98%,分词和词性标注处理速度为31.5KB/s。ICTCLAS 和计算所其他14项免费发布的成果被中外媒体广泛地报道,国内很多免费的中文分词模块都或多或少的参考过ICTCLAS的代码。
下载页面:http://www.nlp.org.cn/project/project.php?proj_id=6
由于 ICTCLAS 是由 C 语言写成的,现在主流的开发工具用起来不太方便,于是有一些热心的程序员把 ICTCLAS 改为 Java 和 C# 等其他语言。
(1)fenci,Java 的 ICTCLAS,下载页面:http://www.xml.org.cn/printpage.asp?BoardID=2&id=11502
(2)AutoSplit,另一个 Java 的 ICTCLAS,已经找不到下载页面,点击本地下载
(3)小叮咚中文分词,曾经有下载页面,现在找不到了。据作者介绍,从 ICTCLAS 中改进,有 Java,C# 和 C++ 三个版本,介绍页面:http://www.donews.net/accesine
2、海量智能分词研究版
海量智能计算技术研究中心为了使中文信息处理领域的研究者们能够共同分享海量智能中心的研究成果,共同提高中文信息处理水平,特此发布《海量智能分词研究版》,供专家、学者和爱好者进行研究。
下载页面:http://www.hylanda.com/cgi-bin/download/download.asp?id=8
3、其他
(1)CSW中文智能分词组件
运行环境:Windows NT、2000、XP 或更高,可以在 ASP,VB 等微软的开发语言中调用。
简介: CSW中文智能分词DLL组件,可将一段文本自动的按常规汉语词组进行拆分,并以指定方式进行分隔,且可对其拆分后的词组进行语义、词频标注。其广范应用于各行各业的信息资料检索、分析。
下载页面:http://www.vgoogle.net/
(2) C# 写的中文分词组件
据作者介绍,一个 DLL 文件,可以做中英文分词组件。完全C#托管代码编写,独立开发。
下载页面:http://www.rainsts.net/article.asp?id=48编辑 引用 报告 评分 回复 顶部查看 IP dongdonglang版主Rank: 7Rank: 7Rank: 7

UID 1000精华 0积分 39帖子 11阅读权限 100注册 2006-11-11状态 在线
#3发表于 2007-1-24 04:41 PM 资料 文集 短消息 三>、开源spider一览
spider是搜索引擎的必须模块.spider数据的结果直接影响到搜索引擎的评价指标.
第一个spider程序由MIT的Matthew K Gray操刀该程序的目的是为了统计互联网中主机的数目
Spier定义(关于Spider的定义,有广义和狭义两种).
* 狭义:利用标准的http协议根据超链和web文档检索的方法遍历万维网信息空间的软件程序.* 广义:所有能利用http协议检索web文档的软件都称之为spider.
其中Protocol Gives Sites Way To Keep Out The 'Bots Jeremy Carl, Web Week, Volume 1, Issue 7, November 1995 是和spider息息相关的协议,大家有兴趣参考robotstxt.org.Heritrix
Heritrix is the Internet Archive's open-source, extensible, web-scale, archival-quality web crawler project.
Heritrix (sometimes spelled heretrix, or misspelled or missaid as heratrix/heritix/ heretix/heratix) is an archaic word for heiress (woman who inherits). Since our crawler seeks to collect and preserve the digital artifacts of our culture for the benefit of future researchers and generations, this name seemed apt.
语言:JAVA, (下载地址)http://sourceforge.net/project/showfiles.php?group_id=73833&package_id=73980WebLech URL Spider
WebLech is a fully featured web site download/mirror tool in Java, which supports many features required to download websites and emulate standard web-browser behaviour as much as possible. WebLech is multithreaded and comes with a GUI console.
语言:JAVA, (下载地址) http://sourceforge.net/project/showfiles.php?group_id=38170
JSpider
A Java implementation of a flexible and extensible web spider engine. Optional modules allow functionality to be added (searching dead links, testing the performance and scalability of a site, creating a sitemap, etc ..
语言:JAVA, (下载地址)http://sourceforge.net/project/showfiles.php?group_id=65617
WebSPHINX
WebSPHINX is a web crawler (robot, spider) Java class library, originally developed by Robert Miller of Carnegie Mellon University. Multithreaded, tollerant HTML parsing, URL filtering and page classification, pattern matching, mirroring, and more.
语言:JAVA, (下载地址)http://sourceforge.net/project/showfiles.php?group_id=48810
PySolitaire
PySolitaire is a fork of PySol Solitaire that runs correctly on Windows and has a nice clean installer. PySolitaire (Python Solitaire) is a collection of more than 300 solitaire and Mahjongg games like Klondike and Spider.
语言ython , (下载地址)http://sourceforge.net/project/showfiles.php?group_id=86107
The Spider Web Network Xoops Mod Team
The Spider Web Network Xoops Module Team provides modules for the Xoops community written in the PHP coding language. We develop mods and or take existing php script and port it into the Xoops format. High quality mods is our goal.
语言hp , (下载地址) http://sourceforge.net/projects/tswnmoddev
Fetchgals
A multi-threaded web spider that finds free porn thumbnail galleries by visiting a list of known TGPs (Thumbnail Gallery Posts). It optionally downloads the located pictures and movies. TGP list is included. Public domain perl script running on Linux.
语言erl , (下载地址)http://sourceforge.net/project/showfiles.php?group_id=110338
Where Spider
The purpose of the Where Spider software is to provide a database system for storing URL addresses. The software is used for both ripping links and browsing them offline. The software uses a pure XML database which is easy to export and import.
语言:XML , (下载地址)http://sourceforge.net/project/showfiles.php?group_id=115931
Sperowider
Sperowider Website Archiving Suite is a set of Java applications, the primary purpose of which is to spider dynamic websites, and to create static distributable archives with a full text search index usable by an associated Java applet.
语言:Java , (下载地址)http://sourceforge.net/project/showfiles.php?group_id=90254
SpiderPy
SpiderPy is a web crawling spider program written in Python that allows users to collect files and search web sites through a configurable interface.
语言ython , (下载地址)http://sourceforge.net/project/showfiles.php?group_id=55531
Spidered Data Retrieval
Spider is a complete standalone Java application designed to easily integrate varied datasources. * XML driven framework * Scheduled pulling * Highly extensible * Provides hooks for custom post-processing and configuration
语言:Java , (下载地址)http://sourceforge.net/project/showfiles.php?group_id=90769
webloupe
WebLoupe is a java-based tool for analysis, interactive visualization (sitemap), and exploration of the information architecture and specific properties of local or publicly accessible websites. Based on web spider (or web crawler) technology.
语言:java , (下载地址)http://sourceforge.net/project/showfiles.php?group_id=121963
ASpider
Robust featureful multi-threaded CLI web spider using apache commons httpclient v3.0 written in java. ASpider downloads any files matching your given mime-types from a website. Tries to reg.exp. match emails by default, logging all results using log4j.
语言:java , (下载地址)http://sourceforge.net/project/showfiles.php?group_id=126578
larbin
Larbin is an HTTP Web crawler with an easy interface that runs under Linux. It can fetch more than 5 million pages a day on a standard PC (with a good network).
语言:C++, (下载地址)http://sourceforge.net/project/showfiles.php?group_id=42562

三、SEO相关资源
1、域名信息查询
  ★ 查询国际顶级域名的信息(.aero, .arpa, .biz, .com, .coop, .edu, .info, .int, .museum, .net, .org),可以通过ICANN授权的域名注册商来查询,也可以直接到INTERNIC网站查询,网址是
  http://www.internic.com/whois.html
http://www.iwhois.com/
  ★ 查询全球各个地理顶级域名是否已经被注册可以到下列网址查询(其中也包括国内域名.cn):
  http://www.uwhois.com/cgi/domains.cgi?User=NoAds
  ★ 查询国内域名的注册情况,
  http://ewhois.cnnic.net.cn/index.jsp
★ 万网的域名注册信息查询
http://www.net.cn/
★ IP地址查询、域名注册信息Whois查询
http://ip.zahuopu.com/
2、alexa相关与搜索排行榜
★ 中文排名500强
http://www.alexa.com/site/ds/top ... &lang=zh_gb2312
★ Google Zeitgeist--Google搜索排行榜
http://www.google.com/press/intl-zeitgeist.html#cn
★ 百度中文搜索风云榜
http://top.baidu.com/
★ 雅虎搜索排行榜
http://misc.yahoo.com.cn/top_index.html
★ 搜狗搜索指数
http://www.sogou.com/top/
3、搜索关键词查询
★ google关键字查询 https://adwords.google.com/select/KeywordSandbox★ 百度关键字查询 http://www2.baidu.com/inquire/dsquery.php★ 搜狐关键词 http://db.sohu.com/regurl/pv_price/query_consumer.asp

4、外部链接查询
★ 搜狗Link查询 http://www.sogou.com/features/
5、seo项目/工具
★网页质量 http://category.booso.com/cgi-bin/category/category.cgi★关键词密度 http://www.21ql.com/seo/keyword.asp★搜索引擎蜘蛛模拟器 http://www.webconfs.com/search-engine-spider-simulator.php
★Google Dance查询工具:http://www.google-dance-tool.com/
6、seo网站
英文网站:
搜索观察 http://www.searchenginewatch.com/seochat http://www.seochat.com
中文网站

在这里可以获取最新的SEO行业信息
搜索引擎优化交流中心 http://www.seoonline.cn
四、各大搜索引擎公司相关资料
1、联系方式
Google
http://www.google.com/intl/zh-CN/contact.html公司总部1600 Amphitheatre ParkwayMountain View, CA94043 USAphone: (650) 253-0000fax: (650) 253-0001电子邮件:chinese_s@google.com
百度
http://d.baidu.com/contact/index.html电话 (010)82621188传真 (010)82607007 82607008E-mail webmaster@baidu.com地址 北京市北四环西路58号理想国际大厦12层邮编 100080
雅虎/一搜
http://cn.yahoo.com/docs/sales/040203_contact.htm总机:010-65811221地址:北京市朝阳区光华东路和乔大厦B座5层雅虎中国搜索事业部邮编:100026传真:010-65812440在线问题提交:http://www.yisou.com/search_feedback.html
中国搜索
http://www.zhongsou.com/kefu/kfzs.htm地址:北京市西直门北大街42号华星大厦a座15.16层邮编:100088总机:010-62266296传真: 010-82211302
搜狐搜索
http://www.sohu.com/about/lianxi.htm地址:北京市海淀区中关村东路1号清华科技园9号威新国际大厦10层邮编: 100084电话: 86-10-62726666传真: 86-10-62728300
新浪搜索
http://ads.sina.com.cn/contact.html北京市北四环西路58号理想国际大厦20层邮编:100080Tel:(86-10)82628888Fax:(86-10)82607166搜索引擎咨询电话:010-82628888转6688搜索引擎联系信箱 searchcn@staff.sina.com.cn
网易搜索
http://so.163.com/contactus.shtml北京市东城区东长安街1号东方广场东方经贸城东三办公楼1901室邮编/Zip:100738网易搜索引擎客服热线:电话:010-82110163-8350、8121、8136E-mail:adp_complaint@service.netease.com

星期六, 十二月 01, 2007

[fwd]C2C简介



C2C什么是C2C

很多人不明白什么是c2c?c2c实际上是电子商务一个专业术语,c2c即c to c ,因为在英文中的2的发音同to,所以c to c简写为c2c。c指的是消费者,因为消费者的英文单词是consumer,所以简写为c。现在大家应该知道c2c的意思就是消费者(consumer)与消费者(consumer)之间的电子商务。打个比方,比如一个消费者的有一台旧电脑,通过网上拍卖,把它卖给另外一个消费者,这种交易类型就称为c2c电子商务。
c2c电子商务主要是指网上拍卖。c2c模式的特点就是大众化交易,因为是个人与个人之间的交易!
C2C中国发展现状
在快速变化的互联网行业,一年的时间足以让沧海变成桑田。
  一年之前,拍拍网的强势介入让C2C领域形成了三足鼎立之势,淘宝、易趣、拍拍三家各有千秋,而又强弱分明。一年的风雨之后再回头来看,太多的事情让原有的格局已悄然改变,强弱之势的异位让C2C进入了更加扑朔迷离的后三国时代。

  淘宝:在领先与压力之间
  毋庸置疑,淘宝在C2C领域的领先地位暂时还无人能够撼动。然而,淘宝却也不得不承受这份领先带来的沉甸甸的压力。在领先与压力之间,淘宝在奋力往前走。
  在中国C2C市场,淘宝的市场份额超过60%。如果是在传统行业,淘宝完全可以高枕无忧。然而在瞬息万变的互联网领域,这样的优势并不是什么不可逾越的屏障。早在2006年5月推出招财进宝受挫,马云便意识到这样的市场地位并不稳固,竞争对手完全可能爆发出惊人的能量,直接挑战淘宝的权威。
  就这样,领先本身就成为了一种压力。后有追兵,前路又是一片茫茫。没有人告诉你前面的路该如何去走,迈出的每一步都成为一次小心翼翼的尝试,可能踏出一片广阔天地,也可能会一无所获。在过去的一年内,淘宝显示了其在创新上的勇气,收购口碑网推出分类信息,大力拓展品牌商城,将团购做成一个频道,将交易的视野扩向全球推出“全球购”频道……很难说这些尝试给淘宝带来的直接收益有多大,但是淘宝却因此明白了什么可以做、什么可以不做。依靠不断的尝试,淘宝在小小翼翼的维护着自己的领先地位。
  对于淘宝而言,领先还有一个代价,就是巨大的资金投入。不管马云夸口的20亿资金投入是否属实,一个无可辩驳的事实是淘宝面临的资金压力越来越明显的显示出来。在悄无声息之中,淘宝对于入住品牌/商城的用户开始收取服务费,而在政策和资源上对于该部分商户的倾斜,以及不自觉间对于小商户的忽视,使得免费的淘宝已经名存实亡。很显然,免费的淘宝已经不能承担巨大的资金压力之重。
  07年,淘宝还在前行,但是每一步都不会再像以前那样轻松和自如。

  拍拍:商品超千万只是另一个起点
  近日,拍拍网对外宣布,其在线商品数突破1000万。商品数突破千万量级意味着,只要是正常的购买需求,用户都可以在拍拍网上得到满足。籍此,拍拍网也正式跻身千万商品俱乐部,目前,进入中国千万商品俱乐部的只有淘宝和拍拍两家。
  06年3月,拍拍网对外宣布正式运营。一年多的快速成长,让依托于腾讯的拍拍网已经成为中国C2C领域一匹潜力十足的黑马。去年5月,拍拍网发布的“蚂蚁搬家”让马云开始认真打量这个快速崛起的竞争对手。07年3月,拍拍网正式宣布其在线商品数突破千万,并且成为了最短时间内打破这一纪录的行业领先者,而这距其正式运营的时间不过一年,成长速度之快,令人乍舌。
  当然,拍拍网的快速发展让中国的C2C市场格局也在悄然发生着变化。在线商品数突破千万,让拍拍在不经意间又逼近了淘宝一步。在Alexa的世界网站排名上,拍拍网跃进国内C2C网站流量排名第二位的位置已经持续了很久。“对于购物网站来说,商品和人流量是两个关键指标。简而言之:当一个商场的商品非常丰富,而来商场的消费者又非常多的时候,商场成交额的提升将是一个必然。而在这两项指标上都跃居第二,这也意味着C2C的产业格局正在悄然改变,三足鼎立的传统格局很有可能会被淘宝、拍拍双峰对峙的局面所替代。”业内专家认为。
  尽管背后有着2.3亿庞大的活跃QQ用户群作为基础,然而,能够取得如此的成长速度仍属不易。业内资深人士认为,和腾讯其他业务的密切捆绑,使得拍拍拥有了很多其他购物平台所无法比拟的差异化优势,而这是拍拍网快速发展的另一个关键原因。以交易腾讯增值产品为主的QQ特区在拍拍中占据着重要的位置。在去年10月,拍拍和QQ空间共同推出的QCC商城就取得了很大的成功。据保守估计,QCC商城给拍拍带来的流量和交易量的提升都在20%以上。
  尽管有着业界最快的成长速度和强劲的发展势头,但是和淘宝相比,拍拍网在市场份额上的差距也并不是凭一日之功就能解决的。对此,拍拍网负责人湛炜标有着非常清醒的认识:“在线商品数突破千万,对于我们来说只是一个新的起点。接下来,我们会在商品搜索、购物流程、支付、物流等方面做持续改进,不断提升用户体验。比如说在最近推出的QQ新版本中,我们就融入了更多的拍拍元素,在进行对话时,可以清晰的显示卖家和商品信息,这样就有助于在沟通过程中快速达成交易。毕竟,用户的选择才是评判一个购物平台是否具有良好发展前景的最好标准。”
  07年,在挑战的道路上,拍拍任重而道远。

  易趣:转型的阵痛
  从本土企业到跨国企业,再从跨国企业到本土企业,转了一个圈,易趣又回来了。不同的是其名字由易趣改成了TOM易趣,老板也从邵亦波变成了王雷雷。
  在去年易趣和TOM合并的时候,王雷雷曾经豪言:“要在半年的时间内找到可行的盈利模式。”半年的时间还没到,豪言能否兑现尚未可知,但是可以看得到的是在TOM易趣身上明显的本土化气息。eBay易趣是不大注重社区的,如今的TOM易趣再次把社区当作重点抓了起来。过完年,易趣忙不迭的推出了年货交易专区,并大做宣传文章,而这在以前的eBay易趣则是不可想象的。
  深入了解中国网民的习惯,并做出与之相对应的调整,易趣正在向一个纯粹的本土企业接近,然而,无可回避的事实是,几经周折的易趣已经元气大伤。在王雷雷的手中,易趣究竟能恢复几成的王者之风,还需要我们拭目以待。

C2C和B2C
艾瑞市场咨询即将出版的《2007年中国网络购物报告》数据显示,俗称“网上开店”的C2C网络购物模式发展快于B2C,两者融合的趋势越来越明显,未来将共同形成最有竞争力的互联网商业模式。

C2C交易额超过B2C
网络购物有两种模式:一种是B2C模式,即商品和信息从企业直接到消费者,另一种是C2C,即商品和信息从消费者直接到消费者,俗称“网上开店”。数据显示,截至2006年年底,网络购物总体交易额达到312亿元,B2C和C2C总体交易额分别为82亿元和230亿元,C2C市场规模同比增加85%,增长速度超过网络购物的整体增速。
从购物内容看,B2C类购买商品种类以音像制品为主,其次是软件类商品;C2C购物网站销售的各类商品中,游戏点卡、数码产品和家居百货等产品都是买家在C2C类购物网站购买的重点。此外,随着买家购买经验的累积和商家对商品描述内容愈发详细和贴切,加上退换货制度的建立,服装鞋帽逐渐成为网络销售中的热门商品种类。
艾瑞市场总监侯涛认为,在市场成长阶段初期,由于相对C2C,B2C交易避免了信用和支付安全等问题,更容易被用户接受,因此交易额在2003年和2004年都高于C2C。但随着第三方支付平台的出现和信用评价体系的建立,C2C更灵活和自由的购物模式也得到越来越多用户的认可。从2005年开始,C2C的交易额快速增长。

形成“内外”争霸格局
艾瑞咨询提供的数据预计,2007年我国网络购物的市场规模将突破500亿元,达到510亿元,增长率则从2002年起点时期的196%下降到2006年60%左右,明年将略有提高,为63.5%。
此外,网络购物注册人数在2006年达到4310万人,预计今年会保持25%以上的增长率,达到5500万人。另据中国互联网络信息中心(CNNIC)发布的第十八次“中国互联网络发展状况统计报告”,在12300万网民数十种网上行为中,通过网络进行购物的比例高达26%。按照这个比例计算,网络购物的直接顾客群将达到3200万人。
然而,如此巨大的市场目前只有寥寥数家瓜分。尽管购物网站数目众多,但由于购物网站需要巨额资金投入,目前只有几家在苦苦支撑,形成“内外”相争的局面。外资代表如卓越网和易趣网;卓越网由金山公司和联想投资创建,2004年被美国电子商务网站巨头亚马逊收购,易趣网引入合作伙伴美国电子商务网站eBay,随后被其全面收购。内资代表如淘宝网和拍拍网,电子商务网站阿里巴巴创建淘宝并多次注资,中国市场上最大的互联网即时通信软件开发商腾讯公司也染指购物网站,成立拍拍网,与淘宝叫板。
这4家购物网站占据了网络购物市场的半壁江山,但是网站间同质化竞争严重。侯涛指出,在B2C、C2C融合的背景下,如果购物网站能够结合自身的网站资源优势进行创新,将能够催生网络购物航空母舰型企业的出现。

中国C2C简史:
1999年: 邵亦波创立易趣网,创中国C2C先河。
1999年8月: 易趣网正式上线。
2002年3月: eBay注资易趣网3000万美元。
2003年5月: 阿里巴巴4.5亿成立C2C网站淘宝网。
2003年7月: eBay斥资1.5亿美元全资收购易趣网。
2004年6月: 易趣网进入与美国eBay平台对接整合。
2005年9月: 腾讯推出拍拍网,2006年3月13日运营。
2006年12月: TOM在线与eBay合资,更名为TOM易趣。
2007年10月: 搜索引擎公司百度宣布进军电子商务,筹建C2C平台,预计2008年初推出。

SNA的讨论-关于Rails大容量网站部署性能的讨论



前段时间就rails的部署的负载能力进行了相关的讨论,请看:

http://www.javaeye.com/topic/19534
http://www.javaeye.com/topic/18675

这两天在安装服务器,顺便到处看了一下,搞清楚了一些对rails的误解。因此对服务器部署有了一些新的想法,和大家探讨一下。

以前我以为rails像PHP那样,以apache的server mod方式运行,今天仔细看了一下FastCGI/SCGI/mongrel的安装手册,这才搞明白,我弄错了。

当FastCGI/SCGI/mongrel方式部署的时候,ruby并不是直接运行在apache的进程中的,而是独立的运行在CGI或者 server上面的。在这种情况下lighthttpd/apache仅仅充当了一个前端HTTP请求分发的代理作用(和静态页面的处理),动态内容交给了后台的ruby CGI/Server去处理的。

其实这种部署方式和我们J2EE常用的apache+(mod_jk)+n个tomcat实例的方式本质上是没有什么区别的。更进一步来说,IBM WebSphere的cluster实际上也是这种方式,在前端使用Apache作为请求分发代理,后面若干个WebSphere实例来处理请求。

在J2EE群集部署方案中,虽然目前的企业应用都强调了应用服务器提供的Session复制功能,EJB调用的负载均衡能力,但是考虑到目前 J2EE潮流发展的趋势,已经不再使用EJB的负载均衡,同时Session复制也被证明为影响cluster水平扩展的主要障碍之一。因此对于大容量的 J2EE水平扩展群集而言,保持每个节点的无状态性,不再使用Session来保持全局状态是必经之路。

因为只有每个JVM进程不保持全局状态,才能够保证n个JVM节点的幂等性,那些所有涉及到全局状态的,必须放在JVM进程之外,例如用户ID可以使用cookie,session可以放入数据库,文件可以放在共享存储系统中。

这样的方案做下来,前端的apache也仅仅是一个HTTP请求代理,后面的应用服务器实例几乎是可以无限水平扩展的,瓶颈永远不会出现在应用服务器层,只会出现在apache端,或者数据库端。当然apache不行,还可以用lighthttpd,甚至使用四层交换机硬件进行请求的分发工作,后端的单台数据库不行,还可以使用多个数据库同步复制,甚至使用Oracle Grid。

这个时候我们考察一下J2EE的群集方案,竟然会发现和Rails的群集方案没有多大的差别了。为了讨论的简单,我们拿J2EE的apache2.2 + tomcat5.5和apache2.2 + mongrel来对比一下:

先看J2EE群集方案:

Apache2.2 proxy分发请求给后面n个tomat5.5实例(这里甚至都不需要使用mod_proxy_ajp,apache直接转发请求给tomcat的http端口);
每个tomcat实例没有内部全局状态,完全是无状态的服务,用户标示从cookie取得,session可以放在数据库中,假设不使用分布式Cache。每个tomcat实例收到一个请求以后,自行处理,然后返回给apache。

再看rails群集方案:

Apache2.2 proxy分发请求给后面n个mongrel实例;
每个mongrel实例也是无状态的,用户标示使用cookie,从apache收到一个请求以后,自行处理,然后返回给apache。

从两者的对比来看,J2EE的每个节点是一个JVM进程,里面若干Java线程都是无状态的,而mongrel据说也是多线程的,rails的每个节点是一个Ruby进程,里面若干ruby线程都是无状态。竟然完全一致的模型!

在这种情况下,究竟是进程多一点,线程少一点;还是进程少一点,线程多一点,都不是最重要的讨论话题,焦点是J2EE和Rails的群集方案是一致的,在应用逻辑处理层的群集水平扩展能力都是近乎无限的,因此都不是系统的瓶颈所在。这意味着什么呢?

这意味着,只要硬件管够,J2EE系统和Rails系统的网站负载能力不会有多大的差别。

也许,ruby的解析执行速度比Java慢,由于没有数据库连接池导致每个请求需要多消耗一些建立物理连接的时间。但是这些因素只能导致单个用户请求的响应时间比Java慢,不会导致整个网站的负载能力差。

也就是说,如果Java的系统,用户打开一个页面需要两秒钟,而Rails的系统,用户打开一个页面可能需要四秒钟,但是他们都能够每天负载100 万的PV,这100万个请求,rails大概也同样是四秒钟,这方面没有什么差别(同样的网站负载,mongrel的实例数量也许远多于tomcat实例数量,但是总体处理能力没有区别)。

当然,J2EE群集方案和Rails群集方案还是有两点不同:

1、J2EE有内置分布式Cache,例如JBoss Cache,而rails的方式是独立的Cache进程在运行,这两种方式来说,对于群集水平扩展,甚至rails的Cache方案还要更好。

2、数据库连接池,对于mongrel,我觉得增加数据库连接池是完全做得到的事情。不过即使不增加连接池,这里也不会成为系统瓶颈,最多会导致数据库多花一些时间在处理连接的建立和断开上面。

最后这种群集部署方案下面,web server退化成为一个请求分发代理,找不到任何理由使用apache了,对,是lighthttpd出场kick off apache的时候。如果网站容量大到连lighthttpd都无法及时分发请求的时候,你还可以用四层交换机来分发请求,那lighthttpd也该被 kick off了。

用J2EE看起来确实能够更加节省硬件,但是我们不能再用Rails无法负载大容量网站的理由来攻击rails了,只有硬件管够,不管是J2EE,还是Rails,都有近乎无限的水平扩展能力。

[fwd]SEDA简介



1.Overview

* SEDA
* An Architecture for Highly Concurrent,Well-Conditioned Internet Services
* Adaptive Overload Control for Busy Internet Servers

SEDA是NIO的重要input,但SEDA框架本身已不再发展。
它的核心思想是把一个请求处理过程分成几个阶段,不同资源消耗的阶段使用不同数量的线程来处理,阶段间使用事件驱动的异步通信模式。

SEDA要求每个Stage需要

* 动态配置自己的线程数
* 在超载时降级运行,如输出纯文字页面
* 在超载时拒绝接收服务

因此每个SEDA的Stage的结构通常有如下组件

* Incoming Event Queue ,事件队列。
* Admission Controller 阀门,拒绝服务。
* Dynamically sized Thread Pool 线程池。
* Event Handler 实际处理业务的Compinent。
* Resource Controller 控制Stage的参数。

2.Web2.0+SOA环境下的SEDA应用

Java EE 迎合 Web 2.0(IBM DW) web2.0虽然最重要的还是策划者的点子,但架构师在Web2.0大潮里也不再无所事事了 因为:
2.1 问题

1.在Web2.0+SOA里,系统越来越多的调用外系统,mashup的应用更需要从外系统pull大量data。
外系统的调用直线增加了任务的时长。cache是一个常用方法,但对一些query result或实时信息较为无力。
而且Web Service调用的时间主要时间花在建立连接与传输数据上,对服务处理的CPU时间花费不大,对服务代码的优化成果不大。
长连接是更有效的方法(比如Ajax的Comet),但要求服务端有高效的处理模型。

2. 在Web2.0里,用户获得了更多的交互动作,会比Web1.0发起更多的请求,尤其是Ajax的大量运用,显示一个页面需要更多的连接交互。

3. 页面的长度也在内容丰富中膨胀。而且页面的数量也因为用户的直接参与创建而疯狂增长。

4. 峰值效应。如果你的网站被某知名网媒头条推荐(如一个著名的新闻站,博客站,社区),可能会在短时间内迎来一个完全超出平时设计容量的访问洪峰。网媒的发达使洪峰发生的概率要远高于1.0时代。

JavaEE 的同步调用机制(除JMS),有限的线程池与连接池(超出范围性能会下降),固定的定义在JNDI的资源对Web2.0/SOA的需求并不吻合。对BEEP,SCTP这些协议,必须依靠JCA另行编写模块来实现长连接模型。

2.2 SEDA的解决方案

从统计学上看,在系统总线程数固定的情况下,使用SEDA能获得较高的Throughput,阶段间的资源差异越大就越明显。
比如处理一个Web 2.0常用请求,有如下几步

1. 接收用户请求(1单位时间)
2. 数据库查询(4单位时间)
3. 根据数据库查询结果,准备Web Service调用参数(1单位时间)
4. 发起Web Service调用((16单位时间))
5. 将结果渲染返回给用户(2单位时间)


那么SEDA会使用一条线程处理1.接收用户请求、3.准备WebService、5.返回结果,两条线程处理数据库查询, 而5条线程处理耗时最多的WebService请求。
而且结果表明,当远程调用所花时间不变,而本地操作得到优化时,系统通量也能获得明显提高。

3. SEDA 实例

* Mule
* MINA

阿里巴巴盈利模式分析



阿里巴巴作为中国电子商务界的一个神话,从98年创业之初就开始了它的传奇发展。它在短短几年时间里累积300万的企业会员,并且每天以6000多新用户的速度增加。不仅仅是搭上了其创始人马云的传奇神话,它的成功更是得力于其准确的市场定位,以及前瞻性的远见。阿里巴巴在电子商务萌芽阶段就商业化地切入,并且踏实的做着自己能力能够做到的事情。自己诚实守信并且在实际行动中致力于规范网上电子商务贸易。这一切在中国二十一世纪的前几年,这个中国电子商务迅速发展的阶段,成就了阿里巴巴今天的成绩。一个错误就可以造成一个失败,但一个成功必然是很多个正确的原因带来的,下面我们就来简单分析一下阿里巴巴网站的运营模式、盈利点、成功之处以及目前和以后的发展战略。
阿里巴巴网站的目标是建立全球最大最活跃的网上贸易市场,它不同于早期互联网公司以技术为驱动的网络服务模式,它从一开始就有明确的商业模式。阿里巴巴具有明确的市场定位,在发展初期专做信息流,绕开物流,前瞻性的观望资金流并在恰当的时候介入支付环节。它的的运营模式是遵循循序渐进的过程,依据中国电子商务界的发展状况来准确定位网站。首先抓基础的,然后在事实过程中不断捕捉新的收入机会。从最基础的替企业架设站点,到随之而来的网站推广以及对在线贸易资信的辅助服务,交易本身的订单管理,不断延伸。其出色的赢利模式符合:赢利的强有力,可持续,可拓展的特点。
具体谈阿里巴巴网站的运营模式主要有以下几个特点:

首先,专做信息流,汇聚大量的市场供求信息。马云曾在05年阿里巴巴在广交会期间主办的电子商务研讨会,阐述了以下观点,即中国电子商务将经历三个阶段,信息流、资金流和物流阶段。目前还停留在信息流阶段。交易平台在技术上虽然不难,但没有人使用,企业对在线交易基本上还没有需求,因此做在线交易意义不大。这是阿里巴巴最大的特点,就是做今天能做到的事,循序渐进发展电子商务。
功能上,阿里巴巴在充分调研企业需求的基础上,将企业登录汇聚的信息整合分类,形成网站独具特色的栏目,使企业用户获得有效的信息和服务。阿里巴巴主要信息服务栏目包括:①商业机会,有27个行业700多个产品分类的商业机会供查阅,通常提供大约50万供求信息②产品展示:按产品分类陈列展示阿里巴巴会员的各类图文并茂的产品信息库③公司全库:公司网站大全,目前已经汇聚4万多家公司网页。用户可以通过搜索寻找贸易伙伴,了解公司详细资讯。会员也可以免费申请自己的公司加入到阿里巴巴“公司全库”中,并链接到公司全库的相关类目中方便会员有机会了解公司全貌。④行业资讯:按各类行业分类发布最新动态信息,会员还可以分类订阅最新信息,直接通过电子邮件接受。⑤价格行情:按行业提供企业最新报价和市场价格动态信息⑥以商会友:商人俱乐部。在这里会员交流行业见解,谈天说地。其中咖啡时间为会员每天提供新话题,为会员分析如何做网上营销等话题。⑦商业服务:航运、外币转换、信用调查、保险、税务、贸易代理等咨询和服务。这些栏目为用户提供了充满现代商业气息,丰富实用的信息,构成了网上交易市场的主体。

第二,阿里巴巴采用本土化的网站建设方式,针对不同国家采用当地的语言,简易可读,这种便利性和亲和力将各国市场有机地融为一体。阿里巴巴已经建立运作四个相互关联的网站:英文的国际网站(http://www.alibaba.com)面向全球商人提供专业服务;简体中文的中国网站(http://china.aliaba.com)主要为中国大陆市场服务;全球性的繁体中文网站(http://chinese.alibaba.com)则为台湾、香港、东南亚及遍及全球的华商服务;韩文的韩国网站(http://kr.alibaba.com)针对韩文用户服务(目前不可用),日文的日本网站(http://japan.alibaba.com)。而且即将推出针对当地市场的欧洲语言和南美网站。这些网站相互链接,内容相互交融,为会员提供一个整合一体的国际贸易平台,汇集全球178个国家(地区)的商业信息和个性化的商人社区。

第三,在起步阶段,网站放低会员准入门槛,以免费会员制吸引企业登录平台注册用户,从而汇聚商流,活跃市场,会员在浏览信息的同时也带来了源源不断的信息流和创造无限商机。截至2001年7月,阿里巴巴会员数目已达73万,分别来自202个国家和地区,每天登记成为阿里巴巴的商人会员超过1500名。阿里巴巴会员多数为中小企业,免费会员制是吸引中小企业的最主要因素。在市场竞争将日趋复杂激烈的情况下,中小企业当然不肯错过这个成本低廉的机遇,利用网上市场来抓住企业商机。大大小小的企业活跃于网上市场,反过来为阿里巴巴带来了各类供需,壮大了网上交易平台。阿里巴巴每月页面浏览量超过4500万,信息库存买卖类商业机会信息达50万条,每天新增买卖信息超过3000条,每月有超过30万个询盘,平均每条买卖信息会得到四个反馈。

第四,阿里巴巴通过增值服务为会员提供了优越的市场服务,增值服务一方面加强了这个网上交易市场的服务项目功能,另一方面又使网站能有多种方式实现直接赢利。尽管目前阿里巴巴不向会员收费,但据马云介绍,阿里巴巴网站目前是赢利的。阿里巴巴的赢利栏目主要是:中国供应商、委托设计公司网站、网上推广项目和诚信通。中国供应商是通过ALIBABA的交易信息平台,给中国的商家提供来自各国国际买家的特别询盘。客户可以委托阿里巴巴作一次性的投资建设公司网站,这个项目主要是alibaba帮助企业建立拥有独立域名网站,并且与alibaba链接。网上推广项目,是由邮件广告、旗帜广告、文字链接和模块广告组成。邮件广告由网站每天向商人发送的最新商情特快邮件插播商家的广告;文字链接将广告置于文字链接中。新推出的诚信通项目能帮助用户了解潜在客户的资信状况,找到真正的网上贸易伙伴;进行权威资信机构的认证,确认会员公司的合法性和联络人的业务身份;展现公司的证书和荣誉,用业务伙伴的好评成为公司实力的最好证明。

第五,适度但比较成功的市场运作,比如福布斯评选,提升了阿里巴巴的品牌价值和融资能力。阿里巴巴与日本互联网投资公司软库(Softbank)结盟,请软库公司首席执行官、亚洲首富孙正义担任阿里巴巴的首席顾问,请世界贸易组织前任总干事、现任高盛国际集团主席兼总裁彼得•萨瑟兰担任阿里巴巴的特别顾问。通过各类成功的宣传运作,阿里巴巴多次被选为全球最佳B2B站点之一。2000年10月,阿里巴巴荣获二十一世纪首届中国百佳品牌网站评选"最佳贸易网"。

从业务角度来看,阿里巴巴的赢利点主要在以下四方面:
1设企业站点
2网站推广
3诚信通
4贸易通

从另一个角度,我们还可以将阿里巴巴的利益点做如下归纳:  
一、诚信安全  
A、几百万的诚信通会员,通过第三方评估认证,定期进行榜单追踪,网上企业诚信指数一目了然。
B、电子支付系统——支付宝,确保买卖双方资金的安全流动。
C、十大网商成功实例、十大浙商成功实例、十大粤商成功实例。
D、几百万诚实守信的网商。
二、品牌资质
福布斯连续5年全球最佳B2B网站。
中国最大B2B网站。
全球电子商务领袖。
三、快捷方便
即使相隔千里,照样实现点对点的沟通和交易。
四、成本低廉
免费注册,普通会员交易不受任何费用。
诚信通会员只须缴纳2300元年费,就可开展国内贸易,无须其他附加费用。
五、渠道广阔
 A、阿里巴巴网络覆盖亚、欧、美,真正做到足不出户,照样把产品卖到国外。
B、通过阿里巴巴结识众多志同道合的网商,共同打开财富之门。
六、海量信息
通过传统渠道无法获取的供求信息,在阿里巴巴网站上,都能找到。

综合以上分析阿里巴巴目前能够有这样的成功,可以总结为这样一句话:良好的定位,稳固的结构,优秀的服务。
1、准确的定位于最初做信息交流平台绕开困难,充分发展。然后在资金流相对解决的时候推出相应的接口工具支付宝占领先机并为自己的平台提供强有力的支撑。
2、稳固的结构。WTO首任总干事萨瑟兰出任阿里巴巴顾问,美国商务部、日本经济产业省、欧洲中小企业联合会等政府和民间机构均向本地企业推荐阿里巴巴。传统渠道领域为阿里巴巴提供了强有力支撑。("倾听客户的声音,满足客户的需求"也许是阿里巴巴生存与发展的根基,根据相关的调查显示:阿里巴巴的网上会员近五成是通过口碑相传得知阿里巴巴并使用阿里巴巴;各行业会员通过阿里巴巴商务平台双方达成合作者占总会员比率近五成。)
3、在产品与服务方面,阿里巴巴公司为中国优秀的出口型生产企业提供在全球市场的"中国供应商"专业推广服务。中国供应商是依托世界级的网上贸易社区,顺应国际采购商网上商务运作的趋势,推荐中国优秀的出口商品供应商,获取更多更有价值的国际订单。截至2003年5月底加盟企业达到近3000家。目前已经有70%的被推荐企业已在网上成交,众多类别市场名额已满。2002年3月开始为全球注册会员提供进入诚信商务社区的通行证-"诚信通"服务。阿里巴巴积极倡导诚信电子商务,与邓白氏、ACP、华夏、新华信等国际国内著名的企业资信调查机构合作推出电子商务信用服务,帮助企业建立网上诚信档案,通过认证、评价、记录、检索、反馈等信用体系,提高网上交易的效率和成功的机会。每月赢收以双位数增长。

另外,除了上述谈到的方面阿里巴巴在人力资源管理理念,市场拓展战略方面都有过人的聪明远见之处。阿里巴巴所用人才按照四年的速度在更新,保持其团队的年轻与时代创新性。在市场拓展方面方面,阿里巴巴并购了雅虎中国目的就是在于做搜索引擎,阿里巴巴现在潜心培育淘宝网。商机搜索、高级智能化的商品、商家信息搜索在未来都有可能成为阿里巴巴强大的核心产品。我想,商业化的运作、超前的想象力和坚强的技术后盾加上阿里巴巴已经积累的庞大的客户,真正阿里巴巴模式也许会在2009年真的出现。
总的来说阿里巴巴网站是一个成功的网上交易平台,它提供来自全球商业机会信息以及商人交流社区,其所有的供求信息由买卖双方自动登陆,会员之间以自由开放的形式在这个平台上寻找贸易伙伴,磋谈生意。可以说在互联网上建立了一个无地理和时间障碍的自由贸易市场,用户从中可获得前所未有的商机。

它发展八年来取得了惊人的成功,这与它成功独到的商业模式是分不开的。但是我们在研究它的时候千万也要看到众多模仿该模式的企业的失败。由阿里巴巴网站的商业模式我们可以得出结论,真正开放的、内容具有本土化特色、信息全球性并且协同性强的电子商务是具有强大的生命力的。但是像这种E-market要生存和发展必须本着为企业提供公平竞争空间的原则,融合参与企业信息资源,达到规模经济效果。中国人做电子商务,不能迷信任何国家电子商务模式,必须有所借鉴亦有所自立。从阿里巴巴网站的商业模式的成功经验之中,我们不仅要学习它可以借鉴的东西,更要能为发展自己的电子商务寻找到适合中国不同阶段具体国情的自己的道路。
 

阿里巴巴的盈利模式:难以模仿

研究网络创收阿里巴巴是绕不过去的。

正如方博士说:“BtoB商业模式是互联网所有商业模式里面最苦最累的一个。”

如果说亚玛逊是全球B2C的典范,阿里巴巴是世界B2B的典范。它是世界规模最大而且多渠道高盈利的唯一的B2B网站。正像马云说:“直到今天为止人家还说美国没有成功的BTOB,没有上市公司做BTOB。”“我们打着望远镜也找不到竞争对手。”

阿里巴巴的盈利模式人们谈论很多,我想可否总结为:它是组合盈利拳,是进化盈利链,是动态发展的盈利模式。将其归结到企业战略和核心竞争力的一个共同点上,就是“难以模仿”。阿里巴巴的盈利模式是难以模仿的一个典型。

它的关键的棋步,如果算上准备出台的,有以下4步:

阿里巴巴成功的第一步是抢先快速圈地。1988年马云以5万元起家时,中国互联网先锋赢海威已经创办了3年。赢海威采用美国AOL的收费入网模式,这对于经济发展水平的高的国家本身经济实力强而且网络信息丰富的AOL是适用的。马运并没有采用赢海威的收入模式,而采用了免费大量争取企业的方式,这对于一个个人出资的公司,是非常有洞见和魄力的。(记得1997年,我曾经向赢海威建议为福建省获评企业赠送免费的电子邮件信箱被婉拒)。坚持这样一种模式是需要坚毅的精神的。在遭遇互联网寒冬的2001年马云给公司定了一个目标,要做最后一个站着的人。他说: “今天是很残酷,明天更残酷,后天很美好,但是很多人都看不到后天,因为他们死在明天的晚上”。 这种抢先圈地的模式坚持下来并贯彻至今,现在阿里巴巴在中国的企业会员是700万家,海外是200多万家。时机本身是最不可模仿的。现在如果谁还重复阿里巴巴的这一战略,还可能占有这么多的企业吗?

如果仅仅逗留在圈地上,可以断定阿里巴巴无法获得4次私募融资了,早就灰飞烟灭了。马云成功的第二步是利用第一步的成功开展企业的信用认证,敲开了创收的大门。信用对于重建市场经济和经济刚起飞的是中国市场交易是拦路虎,电子商务尤为突出。马云抓住了这个关键问题,2002年力排众议创新了中国的互联网上的企业诚信认证方式。如果说,这种方式在普遍讲诚信的发达国家,是多余的,在中国则是恰逢其时了。阿里巴巴既依靠了国内外的信用评价机构的优势,又结合了企业网上行为的评价,恰当配合了国家和社会对于信用的提倡。由于有了创收的渠道,2002年马云给公司提出一个目标,全年赚一块钱。到03年的时候,就达到一天有100万了。现在这个项目,阿里巴巴带来每年几千万元的不断增加的收入。

这里要特别指出,中国信用问题突出,不等于企业就愿意参与你阿里巴巴的诚信通认证。在诱导企业缴费加入“诚信通”方面阿里巴巴巧妙利用了它抢先圈地的成果。几百万的企业为它提供了大量的企业需求信息。这对于60%加工能力过剩的中国企业是非常宝贵的信息。阿里巴巴仅仅对于通过诚信通的企业提供需求信息,还通过电子邮件一年提供3600条。这些需求信息对于众多千方百计寻求订单的企业来说,其价值不言而喻,最起码也有把握现实的市场动态的参考价值。用圈地中换取的关键信息作为企业进入创收项目的“诱饵”,这也是难以模仿的无的招术。

阿里巴巴的第三部就是他掌握5000家的外商采购企业的名单,可以实实在在帮助中国企业出口。对于每家企业收费4-6万元这又为阿里巴巴带来每年大几千万元的收入,并带来国内外的知名度。这一招其他单位也可以学,但阿里巴巴等于外商的采购有最大规模的供给信息和诚信通为基础的优势,其他单位是难以模仿的。

阿里巴巴的第四招,是他今年8月收购雅虎中国后准备推出的电子商务搜索。今年3月阿里巴巴的已经推出自己的关键字竞价搜索。雅虎的搜索在中国仅低于百度3个百分点,超过全球龙头google8个百分点。现在阿里巴巴依靠雅虎每年几十亿美元技术开发投入形成的技术实力必然要有所创新。创建全球首个有影响力和创收力的专业化搜索应当是合理选择。电子商务搜索可以将电子商务的涉及的产品信息、企业信息,还有物流、支付有关信息都串通起来。可以逐步自然形成一种电子商务信息的标准。可以首先推进阿里巴巴的电子商务,并统领全国的电子商务。中国去年的出口额是1万亿美元,通过阿里巴巴做的只有100亿美元是1%,还有99%的企业并没有使用电子商务,这里面的生意潜力可就太大了。这一招将又是以前三招为基础而难以模仿的。

阿里巴巴的关键的招术并不多,但招术的单纯性、连贯性、组合性和有效性非常突出。最典型的例子就是2001年间,马云也险些迷失了方向。获得两轮风险投资后,“想做大”的马云邀请了多名在海外有优秀履历的人才。“在阿里巴巴内部,坚持各种生意模式的人都有。终于,到2002年底,马云将他们一一清退,同时,他把当时占据公司收入60%的系统集成业务一刀砍下,以保证公司继续按自己设定的方向前进。

从里巴巴模式难以模仿的盈利模式背后的思想和理念是可以模仿的,我们可以学习和仿效的阿里巴巴的是对于网络形势的深度洞察,洞察到可以翘动公司发展的杠杆点,以创新作为杠杆,还有就是翘动杠杆的执行力的坚决和坚定。如果再浓缩阿里巴巴的难以模仿的盈利模式的核心就是——难以模仿的创新。创新时就要不仅仅考虑有效性,还要考虑难以模仿性。难以模仿给阿里巴巴带来的是自然的垄断巨大效益。

我们不拒绝模仿,面对模仿的目标是难以模仿时,要以创新超越。创新是无限的,我们不要馁于模仿。
[fwding]