-大数据架构商业之路:从业务需求到技术方案 (大数据技术丛书)
        -推荐序一
        -推荐序二
        -前言
                    -为什么要写这本书
                    -读者对象
                    -如何阅读本书
                    -勘误和支持
                    -致谢
        -第1章 抉择
        -第2章 数据收集
            -2.1 互联网数据收集
                -2.1.1 网络爬虫
                -2.1.2 Apache Nutch简介
                -2.1.3 Heritrix简介
            -2.2 内部数据收集
                -2.2.1 Apache Flume简介
                -2.2.2 Facebook Scribe和Logstash
            -2.3 本章心得
            -2.4 参考资料
        -第3章 数据存储
            -3.1 持久化存储
                -3.1.1 Hadoop和HDFS
                -3.1.2 HBase简介
    -           含义:返回“员工信息表”中所有员工的姓名
                -3.1.3 MongoDB
            -3.2 非持久化存储
                -3.2.1 缓存和散列
                -3.2.2 Memcached和Berkeley DB简介
                -3.2.3 Redis简介
            -3.3 本章心得
            -3.4 参考资料
        -第4章 数据处理
            -4.1 离线批量处理
                -4.1.1 Hadoop的MapReduce
                -4.1.2 Spark简介
                -4.1.3 Hive简介
                -4.1.4 Pig、Impala和Spark SQL
            -4.2 提升及时性:消息机制
                -4.2.1 ActiveMQ简介
                -4.2.2 Kafka简介
            -4.3 在线实时处理
                -4.3.1 Storm简介
                -4.3.2 Spark Streaming简介
            -4.4 本章心得
            -4.5 参考资料
        -第5章 信息检索
            -5.1 基本理念
            -5.2 相关性
                -5.2.1 布尔模型
                -5.2.2 基于排序的布尔模型
                -5.2.3 向量空间模型
                -5.2.4 语言模型
            -5.3 及时性
            -5.4 与数据库查询的对比
            -5.5 搜索引擎
                -5.5.1 Web搜索中的链接分析
                -5.5.2 电子商务中的商品排序
                -5.5.3 多因素和基于学习的排序
                -5.5.4 系统框架
                -5.5.5 Lucene简介
                -5.5.6 Solr简介
    -        在集合
    -       在集合
    -  复制集合
    -            "男装
    -                     "酒红色
    -                     "海蓝色
    -                     "亮白色
    -            "男装
    -            …
                -5.5.7 Elasticsearch简介
    -       "id" : "10012",
    -       "title" : "论八大菜系之川菜
    -       "authors" : ["张三
    -       "date" : "2015.08.20"
    -       "id" : "10012",
    -       "title" : "论八大菜系之川菜
    -       "authors" : [
    -               {
    -                       "name" : "张三
    -                       "gender":"女
    -                       "age":"36"
    -               },
    -               {
    -                       "name" : "李四
    -                       "gender":"男
    -                       "age":"35"
    -               },
    -               {
    -                       "name" : "王五
    -                       "gender":"男
    -                       "age":"28"
    -               }
    -       ],
    -       "date" : "2015.08.20"
    -       "女装
    -               "酒红色
    -                       "尺码
    -                       "尺码
    -                       "尺码
    -                       "尺码
    -               "海蓝色
    -                       "尺码
    -                       "尺码
    -                       "尺码
    -                       "尺码
    -               "亮白色
    -                       "尺码
    -                       "尺码
    -                       "尺码
    -       "女装
    -               "天蓝色
    -               …
    -       …
            -5.6 推荐系统
                -5.6.1 推荐的核心要素
                -5.6.2 推荐系统的分类
                -5.6.3 混合模型
                -5.6.4 系统架构
                -5.6.5 Mahout
            -5.7 在线广告
                -5.7.1 在线广告的类型
                -5.7.2 广告投放机制
                -5.7.3 广告的拍卖机制
                -5.7.4 广告系统架构
            -5.8 本章心得
            -5.9 参考资料
        -第6章 数据挖掘
            -6.1 基本理念
            -6.2 数据的表示和预处理
                -6.2.1 数据的表示
                -6.2.2 数据的预处理
            -6.3 机器学习算法
                -6.3.1 监督学习——分类
                -6.3.2 监督学习——回归
                -6.3.3 非监督学习——聚类
            -6.4 挖掘工具
                -6.4.1 Mahout简介
                -6.4.2 R简介
    -[1] "apple.a"     "apple.b"      "apple.c"      "applea"       "orange.a"
    -[6] "orange.b"    "orange.c"     "watermelon.a" "watermelon.b" "watermelon.c"
    -   Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
    -     * denotes terminal node
    - 2) Petal.Length< 2.45 50   0 setosa (1.00000000 0.00000000 0.00000000) *
    - 3) Petal.Length>=2.45 100  50 versicolor (0.00000000 0.50000000 0.50000000)
    -   6) Petal.Width< 1.75 54  5 versicolor (0.00000000 0.90740741 0.09259259) *
    -   7) Petal.Width>=1.75 46  1 virginica (0.00000000 0.02173913 0.97826087) *
    -            [,1] [,2] [,3] [,4] [,5] [,6] [,7]
    -            Shape Color Texture Weight Feel Taste Class
            -6.5 本章心得
            -6.6 参考资料
        -第7章 效能评估
            -7.1 效果评估
                -7.1.1 离线评估
                -7.1.2 非离线的评估
            -7.2 性能评估
                -7.2.1 计算复杂度
                -7.2.2 应用系统性能
                -7.2.3 JMeter工具
            -7.3 本章心得
            -7.4 参考资料
        -第8章 大数据技术全景
        -第9章 商品太多啦!需要搜索引擎
            -9.1 业务需求
            -9.2 产品设计和技术选型
            -9.3 实现方案
                -9.3.1 数据定义和配置
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -      edismax
    -      AND
    -推荐序一
    -         product_id product_name category_name seller_name
    -推荐序一
    -      100%
                -9.3.2 集群搭建
                -9.3.3 DIH配置
    -推荐序一
    -推荐序一
    -        data-config.xml
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
        -第10章 能否更主动?还需要推荐引擎
            -10.1 业务需求
            -10.2 产品设计和技术选型
            -10.3 实现方案
                -10.3.1 基于内容特征的衡量
    -[1] 0.25 0.28 0.87 0.11 0.62 0.96 0.28 0.08 0.67 0.31 0.75 0.95 0.85 0.68 0.27 0.22 0.78 0.53
    -[1] 0.58 0.84 0.65 0.16 0.32 0.03 0.86 0.11 0.76 0.96 0.41 0.19 0.68 0.28 0.25 0.24 0.26 0.03
    -[1] 0.26 0.38 0.86 0.23 0.60 0.88 0.45 0.12 0.65 0.25 0.48 0.93 0.81 0.62 0.24 0.28 0.85 0.52
                -10.3.2 基于行为特征的衡量
    -    [,1] [,2] [,3]
                -10.3.3 提供在线服务
    -推荐序一
    -推荐序一
    -推荐序一
        -第11章 这样做的效果如何
            -11.1 业务需求
            -11.2 产品设计和技术选型
            -11.3 实现方案
                -11.3.1 行为数据的定义和记录
                -11.3.2 Flume和HDFS的集成
    -推荐序一
    -         fs.default.name
    -         hdfs://10.200.45.2:9000
    -         Name Node
    -推荐序一
    -推荐序一
    -         hadoop.tmp.dir
    -         /Users/dabao.yang/logs
    -         A base for log files.
    -推荐序一
    -推荐序一
    -         mapred.job.tracker
    -         10.200.45.2:9001
    -         The host and port that the MapReduce job tracker runs at.
    -推荐序一
                -11.3.3 通过Hive进行分析
    -   ROW FORMAT DELIMITED
    -   FIELDS TERMINATED BY '|';
    - set hive.exec.reducers.bytes.per.reducer=
    - set hive.exec.reducers.max=
    - set mapred.reduce.tasks=
    - set hive.exec.reducers.bytes.per.reducer=
    - set hive.exec.reducers.max=
    - set mapred.reduce.tasks=
                -11.3.4 Kafka和Storm的集成
    -    Topic: accesslog-topic        Partition: 0        Leader: 3        Replicas: 3,2
    -    Topic: accesslog-topic        Partition: 1        Leader: 0        Replicas: 0,3
    -    Topic: accesslog-topic        Partition: 2        Leader: 2        Replicas: 2,0
    -    Topic: accesslog-topic        Partition: 3        Leader: 3        Replicas: 3,0
    -    Topic: accesslog-topic        Partition: 4        Leader: 0        Replicas: 0,2
    -    Topic: accesslog-topic        Partition: 5        Leader: 2        Replicas: 2,3
    -   - "10.200.5.88"
    -   - "10.200.5.66"
    -   - "10.200.5.32"
    -   - 6700
    -   - 6701
    -   - 6702
    -   - 6703
        -第12章 这个搜索有点逊
            -12.1 业务需求:还要搜得更多
            -12.2 “还要搜得更多”:产品设计和技术选型
            -12.3 “还要搜得更多”的方案实现
                -12.3.1 HBase的部署
    -推荐序一
    -       hbase.rootdir
    -       hdfs://10.200.5.88:9000/hbase
    -推荐序一
    -推荐序一
    -       hbase.cluster.distributed
    -       true
    -推荐序一
    -推荐序一
    -       hbase.Zookeeper.quorum
    -       10.200.5.88,10.200.5.66,10.200.5.32
    -推荐序一
    -推荐序一
    -       hbase.master
    -       10.200.5.88:60000
    -推荐序一
    -推荐序一
    -       Zookeeper.session.timeout
    -       60000
    -推荐序一
    -推荐序一
    -       hbase.Zookeeper.property.clientPort
    -       2181
    -推荐序一
    -推荐序一
    -     hbase.Zookeeper.property.dataDir
    -     /Users/dabao.yang/bigdata/Zookeeper-3.4.6/data
    -推荐序一
    -'o2o_product', {NAME => 'info', DATA_BLOCK_ENCODING => 'NONE',  true
    -BLOOMFILTER => 'ROW', REPLICATION_SCOPE => '0', VERSIONS => '1'
    -, COMPRESSION => 'NONE', MIN_VERSIONS => '0', TTL => 'FOREVER',
    - KEEP_DELETED_CELLS => 'false', BLOCKSIZE => '65536', IN_MEMORY
    - => 'false', BLOCKCACHE => 'true'}
    -product1 column=info:product_name, timestamp=1448417509669, value=Imported Milk Package
    -product1 column=info:product_price, timestamp=1448417598308, value=188.88
    -product2 column=info:group_end, timestamp=1448417745410, value=2016/01/15
    -product2 column=info:group_price, timestamp=1448417716731, value=10.00
    -product2 column=info:group_start, timestamp=1448417733315, value=2016/01/08
    -product2 column=info:price, timestamp=1448417699278, value=30.00
    -product2 column=info:product_name, timestamp=1448417685652, value=A New Movie
                -12.3.2 HBase和Solr的集成
            -12.4 业务需求:还要搜得更准
            -12.5 “还要搜得更准”:产品设计和技术选型
                -12.5.1 提升搜索排序的相关性
                -12.5.2 提升搜索排序的整体效果
            -12.6 “还要搜得更准”的方案实现
    -     相关类目列表
    -     电动剃须刀
    -       国产牛奶
    -       国产咖啡
    -       手机
    -       女羽绒服
            -12.7 业务需求:还要更快
            -12.8 还要“变”得更快:产品设计和技术选型
            -12.9 还要“搜”得更快:产品设计和技术选型
    -     相关类目列表
    -     电动剃须刀
    -       国产牛奶
    -       国产咖啡
    -       手机
    -       女羽绒服
            -12.10 业务需求:给点提示吧
            -12.11 给点提示吧:产品设计和技术选型
    -         相关类目列表
    -         电动剃须刀
    -   电动剃须刀
    -       电动剃须刀
    -       国产牛奶
    -       冷藏咖啡
    -   手机
    -       女卫衣
    -       美食:
    -           电影:
    -                                     类目
    -         电动剃须刀
    -送啫喱膏
    -      电动剃须刀
    -150ml/瓶
    -              须后水
    -       须后水
    -250ml*24/箱
    -                   国产牛奶
    -250ml*12/箱
    -240ml*12/箱
    -             国产牛奶
    -200ml*12盒
    -       国产牛奶
    -                    KTV笑哈哈影院电影周二特价场
    -                     电影
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -推荐序一
    -      edismax
    -      AND
    -推荐序一
    -         query pinyin big5
    -推荐序一
    -      100%
        -第13章 支持更高效的运营
            -13.1 业务需求:互联网时代的CRM
            -13.2 互联网时代的CRM:产品设计和技术选型
            -13.3 业务需求:抓住捣蛋鬼
            -13.4 抓住捣蛋鬼:产品设计和技术选型
                -13.4.1 识别分类错放
    -                                   类目
    -       电动剃须刀
    -送啫喱膏
    -    电动剃须刀
    -150ml/瓶
    -            须后水
    -     须后水
    -250ml*24/箱
    -                 国产牛奶
    -250ml*12/箱
    -240ml*12/箱
    -           国产牛奶
    -200ml*12盒
    -     国产牛奶
    -                  KTV笑哈哈影院电影周二特价场
    -                   电影
    -         相关类目列表
    -         电动剃须刀
    -   电动剃须刀
    -       电动剃须刀
    -420,剃须啫喱
    -310,……
    -       国产牛奶
    -       冷藏咖啡
    -   手机
    -       女卫衣
    -       美食:
    -           电影:
                -13.4.2 识别SEO作弊
            -13.5 业务需求:销售之战
            -13.6 销售之战:产品设计和技术选型
                -13.6.1 设置合理的价格
                -13.6.2 识别黄牛
        -后记
Copyright & copy 7dtime.com 2014-2018 all right reserved,powered by Gitbook该文件修订时间: 2018-09-02 18:30:08

results matching ""

    No results matching ""