• Re: 挖个坑,发现python能干的事,java也能干吧。

    py是解释型的

    搞数据挖掘方便

    数据在内存里,可以不断地试,而且pandas等库很方便

    java虽然也有解释器,但目前还不如这个方便

    【 在 codelover (心安是归处) 的大作中提到: 】

    : 本人编程菜鸟一枚,工作中偶尔需要编个程序处理数据,比如最近用selenium,实现通过web批量修改一些设备数据。最近在犹豫要不要学python,python对提高工作效率真的那么有用吗?做爬虫是不是比java方便

    2020-12-27
  • Re: 这种搜索如何实现?

    Wu-Manber毫无问题

    20M关键词而已

    【 在 appletree (绿油油的小麦地) 的大作中提到: 】

    : 这个是正解

    : 只要保证2000万关键词内存能装下

    2020-12-26
  • Re: 这种搜索如何实现?

    这问题算法相关的版面讨论过很多次了

    GFW应该就是用Wu-Manber算法做的

    如果关键词要求动态更新的话,也有人做过可动态更新的Aho-Corasick和Wu-Manber

    【 在 CHNSTAR (北北) 的大作中提到: 】

    : 数据量2000万条以上

    : 要求:某字段值被搜索条件包含

    : 比如:标题搜索条件为 “精通SpringBoot企业级开发”

    : ...................

    2020-12-26
  • Re: 这种搜索如何实现?

    这就是传入一篇文档,找哪些关键词在这篇文档里出现了呗

    【 在 Sinopeus (Sinopeus) 的大作中提到: 】

    : 这是项目经理智商不足70的表现

    : 首先要解决的是换产品经理

    : 什么脑残提这种需求

    : ...................

    2020-12-26
  • Re: 水木如何记录每个人看帖记录的?

    每个人每个版有个大约512bits的文件

    记录最近的帖子

    【 在 RAV4 (hehe) 的大作中提到: 】

    : 看过哪个都记录数据量也不小啊

    2020-12-22
  • Re: 哪个xml库可以获取attribute的行列信息?

    自己写个sax,不麻烦

    dom没敢尝试过,不知要多少工作量

    【 在 darwin2009 (达尔文) 的大作中提到: 】

    : 如果支持xpath还同时支持定位就更好了

    : 发自「今日水木 on Redmi K30i」

    2020-12-15
  • Re: 刘增辉的分页插件PageHelper是获得MyBatis官方网站推荐的

    自己作只会比数据库更慢或者更占硬盘

    【 在 oldwatch (一条叫java的鱼◎城内风光独好) 的大作中提到: 】

    : 查询命中多的话

    : 光靠数据库原生翻页性能会死人的

    : 比如第一万条到第一万零五十条....

    : ...................

    2020-12-04
  • Re: 散分-前50名-水木土豪版为数字货币区块链事业添砖加瓦

    水木土豪版为数字货币区块链事业添砖加瓦

    【 在 fdx119 (头头|YNWA) 的大作中提到: 】

    : 回复:水木土豪版为数字货币区块链事业添砖加瓦

    : 前50名每人100分,发完为止,未按要求回复不给分

    2020-11-02
  • Re: 泄露国家机密的乳业广告

    +1

    也就sb才会觉得好笑吧

    【 在 lalawill () 的大作中提到: 】

    【 在 maruko (没文化,真害怕) 的大作中提到: 】

    : 广告出现了请给我光明

    : 掷重金投放广告的光明,因损害国家尊严或利益而被罚30万

    2020-10-19
  • Re: 有人能通过这个字符串猜出密码的哈希方式吗

    可以反编译啊

    说不定能猜出来算法

    【 在 sunphy (人品就是生产力) 的大作中提到: 】

    : 没有源代码,老系统是另外一个公司做的而且失联状态

    2020-10-09
  • Re:特朗普竞选团队发言人攻击拜登:没得过新冠,没有第一手经验

    侮辱猪了

    【 在 eyepeer (eyepeer) 的大作中提到: 】

    : 全球对病毒传播途径一清二楚的情况下还能被感染,这是蠢猪的经验吗?

    : 发自「今日水木 on 火星」

    2020-10-07
  • Re: 欣赏一段Map拼装字符串的处理代码

    遍历map的方法效率低

    还有脱裤子放屁

    【 在 hjjscofield (heruo) 的大作中提到: 】

    : 槽点主要在什么。

    : 写得挺复杂的。

    : 但没看出什么问题。

    : ...................

    2020-08-17
  • Re: 欣赏一段Map拼装字符串的处理代码

    不熟悉J的人写的吧

    也不是编程老手

    【 在 Mikov (Mikov Chain) 的大作中提到: 】

    : 来源于某支付机构提供给商户的jar包,神器反编译的代码

    2020-08-16
  • Re: 我自己做个网站,租用一个cpu,一个cpu能同时响应100个请求

    不会瘫痪,有的人的页面会慢一点而已

    【 在 ludongxing (ludongxing) 的大作中提到: 】

    : 我想买个服务器用来做个网站。比如说,我的网站提供搜索服务,

    : 每个人搜索的关键词不一样。

    : 1. 如果在同一秒钟内,有100个人使用我的网站搜索各自感兴趣

    : ...................

    2020-07-22
  • Re: 据说接入星链只需要一个48厘米的接收天线

    你想多了

    马斯克说过,在大陆不提供服务

    【 在 zhenxinhero (真心英雄) 的大作中提到: 】

    : 安装只需要2步:把天线立起来,再插上电源

    : 以后这种天线会不会在中国成为违禁品?

    2020-06-23
  • Re: 你们的idea都怎么激活的(6)

    现在不是写var apple = new ClassApple();

    就行了

    【 在 zeus2615 (zeuslord·呆猫) 的大作中提到: 】

    : eclipse当年我用的时候,卡的跟狗一样,以至于我从来不用它的快捷键,因为一套快捷键下去三秒才有反应,还不如鼠标算了。

    : idea有很多功能带来了很多新的习惯。

    : 譬如以前我申明变量

    : ...................

    2020-06-14
  • Re: 有没有这样的map<String , Integer>实现类???

    trove和fastutil都有

    而且还有比这更多的功能

    guava的Multiset也可以

    int add(@Nullable

    E element,

    int occurrences)

    Adds a number of occurrences of an element to this multiset. Note that if occurrences == 1, this method has the identical effect to add(Object). This method is functionally equivalent (except in the case of overflow) to the call addAll(Collections.nCopies(element, occurrences)), which would presumably perform much more poorly.

    Parameters:

    element - the element to add occurrences of; may be null only if explicitly allowed by the implementation

    occurrences - the number of occurrences of the element to add. May be zero, in which case no change will be made.

    Returns:

    the count of the element before the operation; possibly zero

    Throws:

    IllegalArgumentException - if occurrences is negative, or if this operation would result in more than Integer.MAX_VALUE occurrences of the element

    NullPointerException - if element is null and this implementation does not permit null elements. Note that if occurrences is zero, the implementation may opt to return normally.

    【 在 qsw (信梅西得永生我妹梅西欢迎您) 的大作中提到: 】

    : 有没有这样的map<String , Integer>实现类???

    : 就是 这个map.put("a" , 23)的时候

    : 进行判断 :

    : ...................

    2020-06-11
  • Re: 美团面试题设计一个过滤敏感词系统我说不会就让我回去等通

    Aho-Corasick和Wu-Manber算法比较好

    Aho-Corasick有很好的Java版开源实现,在hanlp里,而且是个中国人开源的

    【 在 aaa888 (水木总版主) 的大作中提到: 】

    : 用户在对某个商品评价的时候  如果输入的是敏感词  就用 *替换  我不会  就让我回去等通知了

    2020-04-27
  • Re: 美国海军部长批完舰长,交了辞职信..

    小孩子过家家

    【 在 RVN (阿文) 的大作中提到: 】

    https://news.sina.com.cn/w/2020-04-08/doc-iimxxsth4191555.shtml

    :   据美国当地媒体报道,根据一位知情人士透露,在当地时间6日批评被解职的“罗斯福”号航母舰长克罗泽“天真或愚蠢”后,美国海军代理部长托马斯·莫德利在当地时间7日向国防部长马克·埃斯珀提交了辞职信。

    :   据称,埃斯珀和白宫方面都没有向莫德利施加压力,要求其辞职,但目前尚不清楚埃斯珀是否会接受莫德利的辞职信。

    : ...................

    2020-04-08
  • Re: 版面积分变更记录

    支持

    【 在 cestlavie (along the border between earth and hell) 的大作中提到: 】

    : 散分了

    2020-04-01