1.6.0版本的变化新特性o删除了几乎所有C/ c++代码,因此在不同平台上编译更容易o基于Spotify (https://github.com/spotify/annoy)生成的Annoy库的新LSH算法。o性能测试现在基于基于等级的重叠测量(http://www.williamwebber.com/research/papers/wmz10_tois.pdf)。升级LSH参数已更改。loadLSHData和freeLSHData已弃用,不再做任何事情,请参阅eiQuery和eiCluster的手册页。详情请参阅手册页。eiCluster现在可以集群数据库的子集,使用ChemmineR中的新特性来存储重复的描述符,只存储一次。o嵌入式描述符现在存储在数据库中,矩阵文件只在LSH创建索引时需要写入。升级数据库模式更改使此版本与1.2或更早版本不兼容。需要重新加载现有的数据库。1.2.0版本的变化新特性o速度改进o ieInit现在接受并行插入的SNOW集群以允许化合物按名称就地更新o eiQuery现在可以返回相似度值而不是距离1.0.0版本的变化新特性o eiR包引入了有效的方法来加速结构相似性搜索和非常大的化合物数据集的聚类。 The acceleration is achieved by applying embedding and indexing techniques to represent chemical compounds in a high-dimensional Euclidean space and to employ ultra-fast pre-screening of the compound dataset using the LSH-assisted nearest neighbor search in the embedding space. This method can drastically reduce the search time of large databases, by a factor of 40–200 fold when searching for the 100 closest compounds to a query.