Layout's Studying Notes

My studying notes for Java,Ruby,Ajax and other any interesting things.

星期六, 一月 28, 2012

最近学习html5小计



简单看了一些html5相关的内容包括:
典型标签
storage
但还需要更深入的学习,不能浅尝辄止。

2012-01-10 21:39: 需要继续学习,推荐书籍:

http://www.cnblogs.com/svage/ 一 个博客,有不少写html5的学习过程

争取在5天内将上述书籍看完,并总结相关经验。
websocket:
1.通过js与服务端直接建立socket进行通讯,目的替代ajax和 comet技术;
2.通讯的内容可以是二进制流和文本;
3.通讯创建过程很简单,使用浏览器的原生socket,性能有保障;
4.jetty7有WebSocketServlet的实 现:http://www.cnblogs.com/svage/archive/2011/11/24 /2262008.html,有一个sample介绍如何通过eclips+jetty+websocket进行通讯,实现了从服务 端进行多线程与客户端通讯。
5.firefox,chrome对websocket的支持目前已经比较 好,opera貌似还不支持,可以通过:window.WebSocket.prototype 查看

星期五, 四月 01, 2011

少年游-林清玄

断鸿声里

是如何的一种感觉?在小巷独步,偶然抬头,别人院墙里的凤凰花探出簇簇火红,而那种花是几年没见的,故乡生长的植物。

凤凰花这种植物喜欢展现自己的红色,仿佛他就是为离别而生的。年少时喜欢粘凤凰花成一只只蝶,登上高楼去随风散放,它旋转飘落的姿态曾经赢得许多童稚的笑声,往事就也像这些蝶一只只飘去,它们纵使旋落的姿态各不相同,终究都会消逝了。 

想起凤凰花,遂想起平生未尽的志事;想起凤凰花,遂想起非梧不栖的凤凰。凤凰花何以要取用"凤凰"的名?这样,老是教人在离绪充溢时,会幻想自己竟是高飞的凤凰,在黑夜将尽时即将展翼呢。

《诗经.大雅》说的:"凤凰鸣矣,于彼高岗;梧桐生矣,于彼朝阳。不经意就浮起一幕深浅分明的影像;一只神鸟翩翩然昂立高岗,振翅欲起;象征高洁的梧桐 树则在朝阳面前,展露挺挺然的面貌。一位少年,一向喜爱梧桐一向倾慕凤凰,蓦然一抬眼,望见凤凰花开离期将届,自己不禁想幻化成一株梧桐以便面对朝阳,或 是一只凤凰以便寒立高岗;或甚至以为自己竟已是一只凤凰,立于高岗的梧桐树上;或是呀!一只清灵的凤凰一展翼,就点破了天蓝!

可是远处若有若无时断时续的骊唱屡屡歌着,如同一首民谣的和声,那么清清玄玄的蜿蜒在主曲里,明明知道不重要,那一首唱过千余日的歌谣,若没有结尾的一小段唱合,也会黯然失色了。

于是凤凰花激起的不仅仅是童年成蝶化蝶的记忆,而是少年梦凤化凰的一段惜情。如火的花的印象配上轻唱的骊声,敲醒了少年的梦境,惊觉到自己既不是凤凰神鸟,也非朝阳梧桐。终于在碎梦中瞧见自己的面容,原来只是一个少年,原来只是一段惊梦。

若干年来死生以赴的求知生活竟然就要过去,没有丝毫痕迹,正如大鸿过处,啼声宛然在耳,纵是啼声已断,却留下来一片感人的凄楚。而个梦凤化凰的少年,也 只是像别人静静地等待分离,在日落前的山头站着,要把斜阳站成夜色,只有夜黑也只有夜黑,才能减去白日凤凰花余影的红艳吧!

 

英雄系马,壮士磨剑

夏天,天总是喜欢下雨,而我总是不爱撑伞,任身子淋得湿淋淋,也不喜欢擦拭,也许我独爱那种凉凉的贴切,也许,我是让它淋着心里的苦涩吧。  

从那条幽幽的长巷走回来,围墙里的建筑工人喜爱快乐地吹口哨,不成曲不成调舒泰 的吹着,在雨中竟吹成一路的凄迷,把夏的雨日也吹的象是深秋的样子,一丝丝穿雨而过。那原是流行着的低俗的曲子,却在高空尖锐地回着旋着,我抬眼望,只看 见他们模糊的身影正砌着一块一块的砖头,想望也望不清楚什么。     

有几次,我借靠路灯沿路走回家,那因为夜晚,只静寂的听见几种虫唱,唧唧 啾啾,唧唧啾啾。我竟怀念起白日听到的低俗口哨呢。于是我只有自己影单单的吹着厂夜色却把它割成零碎,任如何也想不起前一刻吹的是哪一曲―,所以我突然想 起童年妈妈教我唱过的一首儿歌一首很好听的调子,却怎么也唱不出声,倒是妈妈的影子来得清晰,伴我静静地走着夜路。

妈妈是最怕下雨了,她爱叮 咛我撑伞,我瞒着她将伞置在家里,跑到溪畔去玩水,看一条水涨成一片水,我们舞成许多水花。回家又喜欢撒谎,说是忘了带,说是出来时刚好没有下雨,甚至抱 怨那把纸伞已然那么破旧了,因此屁股上常是一片红云。如今每下雨被淋到,就想到那把破旧的油纸伞,在没有人逼着撑伞时,才深切觉到妈妈的爱。我知道家前那 道小小溪水一定还流,只是不知道有多少稚子还瞒妈妈到溪畔玩水,玩成一朵朵水花。

一直到妈妈不再叮咛下雨打把油纸伞,而是叮咛自己浪游应注意的琐务,才知道自己已然长大了。

今天雨下得很大,我走在没有人的街中巷内,突然想起一些旧事。夜深了,我就坐在阑干上仰望天际,月亮星星都钻出云来,星空夜静,余雨未息,我知道明天一 定天好,遂忆起往日爱唱的一首诗:一切都老了,一切都抹上风沙的锈,百年前英雄系马的地方,百年前壮士磨剑的地方,这儿我黯然地卸了鞍,历史的锁啊没有钥 匙,我的行囊也没有剑。要一个铿锵的梦吧,趁月色,我传下悲戚的《将军令》,自琴弦......这样我就轻轻地唱起这首歌来,心中只想到庄严和悲壮。一个 边地的"残堡",看不到英雄系马看不到壮士磨剑看不到笙歌樵唱,只有一轮将西的夕阳挥洒它的残红,而一个卸了鞍的游子目睹这种景象,哪怕是铁石心肠,恐怕 也要黯然吧。

近来读书,经常十分敏感,竟会不自觉就呆着,过后一想,当时眼里一定是迷茫一片,看不清自己的河源,也不知自己的前路,那份感觉 一直走入内里走入中间,等我回顾它即刻就泛滥了,就是不回顾,也知道它细细地流过我的内里我的中间,洗涤得一片清澈。知道自己花初叶嫩,总也经担不起那条 河流,一阵一阵地激荡。

或许我离开此地若干年后,还是喜欢淋雨,到那里那时,就连建筑工人唱的郑声,也会被想成雅乐吧。

 

江湖夜雨十年灯

江湖夜雨十年灯,传说中,古时候的侠士都是佩着一把剑行走江湖的。

又传说中有一种武士,他们虽然练剑,身上却不带剑。他们随时都可以以一根筷子一茎稻草代剑器,甚至可以伤人至死,因此一定要佩剑才能使剑的,已经沦入第二流了。

传说虽只是传说,终究是有所本、不无几分道理,因为剑术练到出神入化,剑气敛于胸中,举手投足间总有几多威力,闪闪逼人,也就是"化身入剑"的境界了。

一把吴钩剑一把七星剑一把龙凤剑都是许多少年梦寐以求的,仿佛是一剑在手就能锄奸去恶无往不利。我也是一个少年,也喜爱拥有一把剑,只要有一把小小的剑,就会引来千古常新的遐思。

或许有几分轻狂,终究是真切的,还有什么比手里拿一把剑更美妙的事?

有时候兀自在夜黑中行着,将大街走成一条细细的小巷,那种苍凉古朴的细致便猛然升起,于是想舞剑想舞成朵朵剑花,此样的感情一旦升起,就随着月下的独影 一直长到远方去,止也止不住,可是长夜将尽,发现囊中已经遗失了剑簇,任是豪气干云,在无人的空巷内在无声的凄寂里在黯淡的夜色中,即是呼风唤雨的手扬 起,最多也只是一种无效的手势吧。

有一回也是夜黑,还夹杂沉默的细雨,走着夜路仿佛走着自己的发自己的影子自己的情调,在自己的生命上舞跃 着,才知道自己那么剑侠那么李白那么无所不在"十五好剑术,偏千诸侯;三十成文章,历抵卿相;白虽身不满七尺,而心雄万夫,王公大臣许以义 气......"李白就这样说着他飘然的诗思也就在旷茫的气势里点化出来。如果说李白的诗歌有什么成就,他胸中那把剑所阐扬出来的气韵,应是最主要的原因 了。

当我回顾,十年,不断地胸中便有一把正气之剑,叶着自己的叶花自己的花结自己的果子,所坚执的也便是,生命成自己的生命。那种不知道藏拙的锋芒,是不是一种挥霍呢?

我真的不肯相信是一种痛苦,也许剑被磨钝了,也许我是一本摊开扉页的书,但是在苦读书中的文字篇章时我害怕,也惊喜,由于翻过的页中有太多的叹息才害怕,由于后来的篇章里显示着精彩的未知才惊喜。知道自己所走的路是一条不馁的路,微小的感触已然难以遮掩它们的不足道。

真的不怕我真的不怕将自己的历史以苍凉的姿态展现出来,或许那样可以成为瞩望将来,但永不忘记过去的人。可是我真怕中夜的偶然凝伫,因为我看到的不只是我自己,而是一叶鲜红的秋海棠,以及它五千年前的创痛。

当然有一天我会庆幸"这辈子总算没有白活",可是此时此刻多年来回忆的凄美,总教我轻轻朗诵自己喜爱自己填的词:想当年带剑江湖,气吞万里如虎;到如今十年夜雨,醉来时响空弦

 

 

一块里程碑

那块里程碑说着说着,它就来了。

分离的神伤若欲雨前的黑云无边无涯地罩下,努力地压抑艰苦地想忘却,它竟毫不留情的在静脉中静静地流着。或者已经等待了太多的夜晚,或者要考验情意的坚挚,离别的伤悲由你的眼底汩汩闪现,在无意蓝而自蓝的天色下,我由泪哭诉出我的爱,说不出心里层层叠叠的颤动。

喜爱荷花浅蓝的韵致,你兴奋地翻墙跑来告诉,山脚的小湖有满湖的荷,我们乃撑一把小小花伞冒着大雨匆匆在泥泞的田路上奔跑,为了看荷花只为了看荷,就激起共同的欢乐。   

站在小湖畔,是有荷却没有开花,我们都有失望。

"没有荷花,荷叶也漂亮,摘一片荷叶回去是一样的。"你说。就是嘴角那一抹轻浅笑意,使裤管溅满泥泞也丝毫不在意,回来后全身湿透,看手上的荷叶相顾大笑,久久不能止息。

有一次记得是黄昏,送你归家回来的路上,遥远处山中的教堂正敲出悠扬嘹亮的钟声,随后是一段浓得化不开重得往下沉的暮乐,低沉得似是由远天那头传来。我 深深被那像极中古世纪的乐音感动,竟坐在家前。阶梯倾听;思维被紧紧系着,一条线千里迢迢追随你的余影。后来好多次也是送你回家归来,也是同样一曲教堂乐 音,依依的心情却一层加深一层,呵,分离真叫人散魄,凌晨里教学也有音乐,却如何也比不上斜阳下暮曲所荡漾的情绪呀。

或然我这一去会到很远很远的地方,或然每一次秋季会暖暖地滑进来,或然我甚至去追寻一群北雁。我的每一个足音却都相信:只要有风有云,我们曾经一起拥有的不仅是回忆,而是延续;只要有声音的地方,你的声音将恒常响在耳际。     

我就即将远扬,在向你诉说时,得以有机会遥望自己生命的既往和来兹,那条坎坷的少年游途上,每一段都立着一块里程碑,里中最古老最完整最美丽最长久的一块,清晰分明地刻着你的名字,以及我不朽的爱。

星期五, 三月 12, 2010

网络广告形式 CPM、CPC、CPA、CPS、CPT

CPM(按展示付费)
 
CPM―英文全称Cost Per Thousand Impression。CPM是一种展示付费广告,只要展示了广告主的广告内容,广告主就为此付费。这种广告的效果不是很好,但是却能给有一定流量的网站、博客带来稳定的收入。只做CPM广告的联盟不是很多,像太极联盟就有CPM广告。
 
CPC(按点击付费)
 
CPC―英文全称Cost Per Click;Cost Per Thousand Click-Through。CPC是一种点击付费广告,根据广告被点击的次数收费。如关键词广告一般采用这种定价模式,比较典型的有Google广告联盟的AdSense for Content和百度联盟的百度竞价广告。
 
CPA(按行为付费)
 
CPA―英文全称Cost Per Action。CPA是一种按广告投放实际效果计价方式的广告,即按回应的有效问卷或定单来计费,而不限广告投放量。CPA的计价方式对于网站而言有一定的风险,但若广告投放成功,其收益也比CPM的计 价方式要大得多。国内最好的CPA广告联盟当属CHANet成果网。
 
CPS(按销售付费)
 
CPS―英文全称Cost Per Sales。CPS是一种以实际销售产品数量来计算广告费用的广告,这种广告更多的适合购物类、导购类、网址导航类的网站,需要精准的流量才能带来转化。卓越网站联盟、当当网站联盟当属这种广告形式的典型代表。
 
CPT(按时长付费)
 
CPT―英文全称Cost Per Time。 CPT是一种以时间来计费的广告,国内很多的网站都是按照"一个月多少钱"这种固定收费模式来收费的,这种广告形式很粗糙,无法保障客户的利益。但是CPT的确是一种很省心的广告,能给你的网站、博客带来稳定的收入。阿里妈妈的按周计费广告和门户网站的包月广告都属于这种CPT广告。
 
广告形式的变化体现了互联网广告发展的趋势,即:广告永远朝着广告主利益和效果最大化的方向发展。作为站长,我们要做的只是做好自己的站,选择最好的广告联盟而已!

星期六, 二月 20, 2010

[fwd]到底有多少面向BI的数据库

BI作为一个方兴未艾的领域, 在我们还没来得及数清到底有多少BI 工具提供商的时候, 大大小小的专门面向BI的数据仓库解决方案已经进入竞争激烈的市场, 其中不乏传统的数据库大鳄,更有不少新兴的创业公司,当然也少不了开源数据库厂商的参与.除开传统的商业智能方面数据库四大天王:teradata , oracle,ibm, microsoft 之外, 也有不少后期之秀不断挑战,像是我们熟知的"以列为导向的"Sybase IQ . 除开我们众所周知的明星之外, 下面介绍一些大家不太熟悉的有潜力的挑战者, 让我们开始这场选秀活动吧(Rock and Roll) :!

bidatabasequadrant

                    Garnter 的数据库魔力四象

我们看到最接近Sybase IQ Netezza 公司是非常有实力的挑战者之一 , 它的主要特点就是面向商业智能并且专注于商业智能领域的应用,其主要产品为Netezza Performance Server系列数据仓库专用设备,为了能够分析商业数据,其数据仓库专用设备中整合了数据库、服务器和存储等各项功能, 你可能对这家公司不太熟悉,但是这家成立于2000年的公司早已经是中高端市场的老大了, 早已经是混的风声水起,即使是Oracle Open World 大会上,oracle hp 推出了硬件和软件组合的两款Exadata Programmable Storage Server HP Oracle Database Machine , Netezza 一样毫不含糊, 立刻展开针对这个组合的宣传,Netezza is fast, Netezza has more processing power, Netezza handles analytics inside the box,netezza is integrated in one box,from one vendor, netezza needs no tunning or indexing, 甚至打出了连圣诞老人都想要netazza 的广告, 专门针对oracle 销售策略,俨然一副我是老大,就算你是oracle hp 跟我抢食也要看你有几分斤两.

公司网址:http://www.netezza.com/

 

Greenplum 也是非常耀眼的新星之一 , 其首要目标就是直指PB 级别的超大型数据仓库, shared-nothing 的架构更是不像Teradata netezza 一样需要专属高端硬件配合, 任何Intel , AMD 芯片的普通服务器都能很容易的搭建集群环境, SQL Parallel Process + MapReduce 技术优势更是其宣传的最大卖点,Teredata 共有5家客户达到PB 级别,其中ebay walmart 的级别更是2PB 1.1 PB , Greenplum 这个运行在普通PC Server 上通过集群的高性能数据库相信在不久的将来也会很快有真正的PB 级别的案例产生. 在获得Sun ,SAP 等公司的风投后共获得4200万美元资金,更在中国建立合作伙伴关系开发国内市场,SUN 更是直言不讳的想通过Greenplum 的优势杀入商业智能市场,带动其服务器,储存和Solaris 的销售, 国内的淘宝团队也开始考虑使用greenplum + hadoop 的技术构建商业智能平台, 它不仅支持SQLMapReduceRPythons 等编程语言,新的3.2 功能还增加了GUI , 性能管理器的功能. 如果你嫌Teredata Oracle RAC 太昂贵的话, Greenplum 一定在你构建超大型数据仓库的考虑范围之内. 注意它虽然构建在Postgresql 之上,但是数据库本身是闭源的商业产品, 因为Postgresql BSD license .

首页: http://www.greenplum.com

http://rdc.taobao.com/blog/dw/archives/category/greenplum

淘宝的一些greenplum 研究.

 

DATAllegro  是一家已经被microsoft 收购的公司,为了补充SQL Server 在商业智能方面的应用. 它同时也提供专属的硬件,microsoft 收购之后已经着手进行整合,产品的最终版本可能要到2010年上半年才能面世. 数据库的规模大概在百T左右.

http://www.datallegro.com/

 

Kognitio是一家提供数据仓库主机托管解决方案提供商(APS,第一次进入Gartner , 主要市场针对UK.

http://www.kognitio.com

 

Sand Technology 是一家加拿大的公司,主要市场在UK,Germany , US. 也是基于列的数据库, 主要强调用廉价的低速磁盘获得可接受的查询性能.

http://www.sand.com/

http://www.dbms2.com/2008/12/16/introduction-to-sand-technology/

 

除了能够上Garnter 的一些厂商之外,还有很多商业产品都各自有其技术优势: 像是Clearpace   比较强调数据归档和压缩,查询性能也能够与Oracle 匹敌(当然没有Netezza 那么肯定的强调) .

还有vertica , 也是强调基于列和网格的数据库,也能进行高性能的分析查询.运行于普通的硬件上,大客户包括JP Morgan Chase ,Vmware 上还有一个装好的vertica analytic database 虚拟机给你玩, 它的ETL 性能测试还刷新的新的ETL记录,一小时转载了5.4TB 的数据.

http://www.vmware.com/appliances/directory/1266

vmware 虚拟机的下载地址.

 

kickfire 一家基于mysql 数据库,但是面向商业智能的基于列的数据库提供商.

还有太多就不一一列举

http://www.paraccel.com

http://db.cs.yale.edu/hstore/

http://www.asterdata.com

http://www.exasol.com/

http://pyrrhodb.msroot.paisley.ac.uk/org/

每个都是各有强调重点, 技术特长不一.

 

就像OLTP 数据库中众多的厂商也没有阻止开源数据库的脚步,data warehouse 数据库中自然也不乏开源的身影.

比较有名的像是Infobright (http://www.infobright.org) , 这是一个基于mysql 的储存引擎, 同样也是基于列计算, 其最大的宣传重点在于高压缩比率和知识网络, 宣传的压缩比率经常在10:1 � 40:1 之间, 其知识网格技术可以不使用索引也能够进行高效率的查询运算.另外还有高速的数据装载工具, 当然还有一些技术上的限制比如缺乏国际支持, 并发性不高, 不能利用多核,没得到WindowsSolaris支持,没有ALTER TABLE有关的支持等, 详情可以查

http://tech.it168.com/a2008/1024/209/000000209206.shtml

 

Bizgres(http://bizgres.org) , 是一个多厂商合作的,主要由greenplum 领导,基于postgresql 的商业智能数据库, 它最大的强调重点就是和其他开源的商业智能工具和平台提供商有很好的合作,像是JasperSoft reporting tools Kinetic Networks ETL tools

 

enterprisedb (http://www.enterprisedb.com) , 在基于postgresql 的基础上构建了OLTP 的数据库,主要走商业路线, 在商业智能领域则是另外一款产品grid sql , 或者说postgresql plus , 听名字就知道强调网格计算, 使运行在普通PC Server 上的数据库可以轻松进行并行计算完成复杂查询,再加上postgresql 本来就有的不少高级特性(物化视图,bitmap index 和分区) , 使得在中小型数据仓库中也值得一试.

 

MonetDB (http://monetdb.cwi.nl/) , 强调其在数据挖掘上的应用,OLAP , GIS, XML Query , 文本和多媒体查询. windows linux 两个版本, 如果你有特殊的商业智能应用,或者科研机构之类的可以研究一下.

 

LucidDB (http://www.luciddb.org/) 将是今天最后一个介绍的数据库, 它强调自己是第一个也是唯一一个只为数据仓库目的建造的数据库,同样也有 列储存,bitmap indexing , hash join/aggregation 等常见数据仓库技术, 新版中强调在线热备份和基于时间点的快照功能, 另外一个最大的特色就是和开源的商业智能厂商之间有很好的合作, 像是开源ETL工具中的kettle talend 都有其插件帮助装载数据, 还有pentaho 最有名的产品,开源OLAP 中的实际标准mondrian 的支持:automatic Mondrian aggregate table designer add-on Mondrian source replication . (: mondrian aggregate pentaho 2.0 新功能之一, 查看我写的pentaho 2.0 新功能一览(http://www.gemini5201314.net/?p=108) )

它同时是Eigenbase 项目的一部分,主要也是强调商业智能和数据仓库这一块的一个项目,和一个商业的中间件sqlstream 可以很好的组合( stream processing ,the SQLstream continuous query engine , 实现实时数据仓库的一个中间件,主要做CDC change data capture, mondrian 的主开发者很喜欢这个东西, 他已经写了两篇介绍这个玩

http://julianhyde.blogspot.com/2008/12/streaming-analytics-over-content-feeds.html

http://julianhyde.blogspot.com/2008/12/streaming-content-feeds-part-2-forging.html

 

trackback: http://www.gemini5201314.net/database/到底有多少面向bi的数据库.html

[fwd]开源BI系统简述

本文介绍了ETL工具、报表工具、OLAP工具的各项开源资源情况,有一定的普及和参考价值。

  这些众多的BI项目从规模和对BI系统支撑的完善程度上来说,大体可以分为FrameworkStand-alone ToolsBI Suit三种类型。

  Framework

  开源框架,这是在商业BI系统中所没有的。我们可以使用它们来构建自己的BI工具,或者增强和扩展我们的BI解决方案。

  Stand-alone Tools

  独立的BI工具,这是开源项目中数量最多的一类。很多工具只侧重BI系统中的某个环节和方面,如ETLReportOLAPDatabase等等。

  BI Suit

  在统一的架构下提供了多种BI系统的特性的工具集合。就目前的情况看,不管是商业软件还是开源软件,还没有任何一个套件提供了完整的端到端的BI解决方案。这些开源的BI Suit是通过连接多个其他的组件和工具的方式形成套件的,由于BI系统涉及到的工具是非常多的,所以整合一套完整的BI解决方案是很困难的。

  BI解决方案中的工具

  一个完整的BI解决方案中有多种工具来完成BI系统中各个阶段的工作。

  ETL工具

  数据抽取、转换和加载工具。优秀的ETL工具应该具有以下特性:

  1 Workflow Management, Job Execution and Scheduling Manager。能方便地定义流程并自动化执行ETL任务。

  2 Centralized Metadata Repository and Management。集中存储和管理符合业界标准的元数据。

  3 Data Profile and Validation。可以检验数据的质量。

  4 High Performance。在大负荷的任务执行中仍然有良好的性能。

  5 Scalable, Platform Independent。具有良好的弹性,支持多种操作系统和数据库系统,能操作多种异构的数据源。

  6 Open Architecture and API。具有开放的架构和易于使用的二次开发接口。

  目前较为知名的开源ETL工具有:

  1 KETL,由具有IBMKPMG背景的Kinetic Networks公司开发,现在已经有三年多的产品应用历史,成功应用于一些产品中,在点击流(ClickStream)分析应用中表现出色。KETL采用Plug-in的架构,使用Java开发。

  2 KETTLE,为一个元数据驱动的ETL工具。已经加入Pentaho

  3 Clover ETL,为一个基于JavaETL Framework,可以用来开发自己的ETL应用。

  4 Enhydra Octopus,为一个基于JavaETL工具,使用JDBC来连接各种数据源,易于使用和部署。曾有人应用于电信网络资源分析系统中。

  报表工具

  优秀的报表工具通常具有以下特性:

  1 支持多种数据源。

  2 直观的可视化设计器,简单易用的报表定制功能。

  3 方便的数据访问和格式化,丰富的数据呈现方式。

  4 符合数据呈现的通用标准,能和应用程序很好地进行结合。

  5 易于扩展和部署。

  目前较为知名的开源报表工具有:

  1 JasperReports,一个优秀的Java报表工具,始于2001,现在JasperSoft公司持续开发和支持该工具。该工具类似于商业软件Crystal Report,支持PDFHTMLXLSCSVXML文件输出格式,现在是Java开发者最常用的报表工具。

  2 OpenReports,提供基于web的灵活报表解决方案,通过浏览器自动生成动态PDF,XLS,HTMLCSV Chart报表,它是用Java开发的,使用JasperReports 作为报表引擎,利用到的开源技术有Hibernate,Veloctiy,Webwork

  3 JFreeReport,现在是Pentaho的一部分,它是一个优秀的用来生成报表的Java类库。它为Java应用程序提供一个灵活的打印 功能并支持输出到打印机和PDF, Excel, HTMLXHTML, PlainText, XMLCSV文件中。

  4 Eclipse BIRT,是Eclipse下面的一个企业智能和报表 工具,能为J2EEWEB应用程序创建漂亮醒目的PDF或者HTML格式的报表,它提供了核心的报表功能。

OLAP工具

  联机分析处理工具。目前开源的OLAP工具也分为MOLAPROLAPHOLAP,优秀的OLAP工具通常有以下特性:

  1 良好的执行性能,能快速地进行分析处理工作。

  2 良好的适用性和可伸缩性。

  3 开放式接口和丰富的API

  目前较为知名的开源OLAP工具有:

  1 Mondrian,是Pentaho的一部分,为一个用Java开发的OLAP服务器,实现了MDX语言、XML解析和JOLAP规范,可以不写SQL就能分析存储于SQL 数据库的庞大数据集,可以封装JDBC数据源并把数据以多维的方式展现出来。

  2 JPivot,是一个JSP 自定制的标签库,可以绘制一个OLAP表格和图表。用户可以执行 典型的OLAP导航,如下钻,切片和方块。它使用Mondrian 作为其OLAP服务器。它使用WCF (Web Component Framework) ,基于XML/XSLT来渲染Web UI组件。JPivot在元数据缓存方面的过于简化的整体性初始化装载的做法将限制它只能处理很小的立方体(Cube)

  数据库

  开源的数据库也有很多,大多数为关系型数据库,少数为应用于数据仓库环境做了专门的优化工作。BizgresPostgreSQL为基础进行了数据仓库环境下的优化,提高了分析查询性能。

  开源BI套件

  下面列出相对成熟和完整,并且有借鉴意义的开源BI套件。

  Bizgres

  为GreenPlum公司主导的开源项目,和Sun公司达成合作关系。BizgresBI应用而对PostgreSQL做了优化,提高了大负荷的并行计算能力,在BI环境中,相对于普通的关系型数据库具有卓越的数据处理性能。Bizgres的数据库平台可以和KETLJasperReports进行整合,从而形成一个BI套件:

  1 数据库:BI专业数据库Bizgres,或者大型应用中的高性能服务器Bizgres MPP,能比普通关系数据库快20

  2 ETL工具:KETL

  3 报表工具:JasperReports

  Openi

  是一个Java开发的Web应用,能对OLAP服务器、关系数据库和数据挖掘服务器进行分析和报表展示,非常易于使用和部署,界面美观友好,后续还将支持数据挖掘和ETL等。Openi主要包括:

  1 OLAP展示:JPivot

  2 报表工具:JFreeChart

  3 分析数据源连接器

  Pentaho

  是一个以工作流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它包括:

  1 工作流引擎:Shark and JaWE

  2 数据库:Firebird RDBMS

  3 集成管理和开发环境:Eclipse

  4 报表工具:Eclipse BIRT

  5 ETL工具:Enhydra/Kettle

  6 OLAP ServerMondrian

  7 OLAP展示:JPivot

  8 数据挖掘组件:Weka

  9 应用服务器和Portal服务器:JBoss

  10 单点登陆服务及LDap认证:JOSSO

  11 自定义脚本支持:Mozilla Rhino Javascript脚本处理器

  由上可见Pentaho是一个很完善的BI解决方案。Pentaho偏向于与业务流程相结合的BI解决方案,侧重于大中型企业应用。

  SpagoBI

  SpagoBI 集成了MondrainJProvit,能够通过OpenLaszlo产生实时报表。SpagoBI使用java开发,不依赖于具体的操作系统,有很强的扩展能力。它主要包括:

  1 报表工具:JasperReports /Eclipse BIRT/ iReport

  2 OLAP ServerMondrian

  3 OLAP展示:JPivot

  4 数据挖掘组件:Weka

  5 Map引擎:Geo

  6 ETLBIE

  7 搜索引擎:Lucene

  8 DashboardOpenLaszlo

  9 Portal ServerJBoss/ Tomcat/ JOnAS

根据其Roadmap可以看出,SpagoBI将融入更多的BI功能,甚至BI之外的功能.

 

Trackback: http://www.cognoschina.net/home/space.php?uid=850&do=blog&id=205

TagClouds

Blog Archive