三人团队打造的学术搜索引擎,直接拿下SOTA!
号称搜索结果相关性平均比谷歌学术高5倍,能搜索超1亿个研究对象,还不依赖LLM。
更重要的是: 免费 ,学生党狂喜!
先来看一波使用效果,输入搜索关键词,只需350毫秒,“啪”得一下高度相关文献就列出来了:
还能再一键筛选出可查看PDF的文件。
从年份、引用次数,到出版类型、具体期刊,都能设定一键过滤:
搜索出来的论文,点击题目即可预览,支持一键复制常见学术引用格式:
这个新搜索引擎名叫,据说目前已处理了超30万次查询,支持24种语言。
为了和谷歌学术等传统学术搜索引擎做比较,开发团队还专门搞了个基准测试,代码库也已开源放了出来,测试结果Lumina搜索结果的相关性拿下SOTA。
开发者发推文叫板谷歌:
AI 3D模拟引擎Ego联合创始人兼CTO、前Meta研究员看过后表示闭眼冲:
还有不少学者表示好使:
搜索相关性最高高11倍
如开头所述,为了测试Lumina的性能,研究团队开源了一个基准测试。
使用GPT-4作为“评判员”,重点比较了Lumina Base(基础搜索模式)、Lumina Recursive(递归搜索模式)、Semantic Scholar和谷歌学术搜索结果的相关性和精确度。
直接检测评估了每个搜索引擎的 前10个搜索结果 ,对比如下:
在基础搜索模式下(Lumina Base),Lumina搜索结果的相关性比谷歌学术高4.8倍,比Semantic Scholar高8倍,评估基于生成的约2470个查询数据集。
Lumina在递归搜索模式下,搜索结果相关性进一步提升,比谷歌学术高6.8倍,比Semantic Scholar高11.3倍,同样基于2470个查询数据集。
此外,Lumina在每次检索中都能稳定提供2-3个 高度相关 结果,相比之下,谷歌学术只有50%的检索能提供1个高度相关的结果,Semantic Scholar则仅有30%的检索能达到这一标准。
换句话说,Lumina可以找到原本很难找到的研究成果。
团队还表示,使用Lumina API和一个简单的递归脚本,可以使相关性比谷歌学术高11倍,Lumina API即将发布。
除了基本的检索,Lumina还提供 AI概述 功能。
比如用“机器学习”关键词搜索,它就会引用检索出来的论文总结介绍机器学习:
点击AI概述中有下划线的关键词,就会触发对该关键词的进一步检索:
AI概述下方还有对搜索论文研究成果图表的汇总:
三人团队打造
Lumina背后是一个仅有三人的开发团队,已获YC投资。
联合创始人兼CEO Mehul Chadda,本科毕业于美国威斯康星大学麦迪逊分校材料工程专业,前高精度科学仪器公司CAMECA制造工程师,负责过原子探针研发工作。
联合创始人兼CTO Akhilesh Sharma,本科毕业于美国伊利诺伊大学香槟分校完成机械工程专业,之前是社交媒体平台Postpress的联合创始人和技术主管,也曾担任美国技术咨询公司Neudesic云技术相关顾问。
联合创始人Ishaan Kapoor,加州大学洛杉矶分校统计学毕业,对深度学习、线性代数和大语言模型感兴趣。
除了这次上新的学术搜索引擎,之前团队还做了一个AI论文解读工具—— Lumina-chat 。
点击Lumina主页右上角的“Legacy System”即可跳转使用。
打开后是这样婶儿的,可以上传PDF与AI交互进行论文解读:
感兴趣的童鞋可以试试~
国外学术信息检索哪个网站好?
谷歌学术是一个可以免费搜索外文学术文章的搜索引擎,包括了世界上绝大部分出版的学术期刊,谷歌学术可了解有关某一领域的学术文献;了解某一作者的著述,并提供书目信息(引用时必需的图书出版信息或期刊论文的刊名、刊期信息)。 部分文献可直接下载。
Elsevier(sciencedirect)是荷兰一家全球著名的学术期刊出版商,每年出版大量的学术图书和期刊,大部分期刊被SCI、SSCI、EI收录,是世界上公认的高品位学术期刊。
Web of Science是获取全球学术信息的重要数据库,它收录了全球多种权威的、高影响力的学术期刊,内容涵盖自然科学、工程技术、生物医学、社会科学、艺术与人文等领域。 Web of Science 包括著名的三大引文索引数据库(SCI、SSCI、A&HCI)。
Wiley Online Library为全学科期刊全文数据库,出版物涵盖学科范围广泛——包括化学、物理学、工程学、农学、兽医学、食品科学、医学、护理学、口腔医学、生命科学、心理学、商业、经济学、社会科学、艺术、人类学等多个学科大约1600多种期刊,以及很多其它重要的跨学科领域的期刊。
SpringerLink是全球最大的在线科学、技术和医学(STM)领域学术资源平台。 Springer 的电子图书数据库包括各种的Springer图书产品,如专著、教科书、手册、地图集、参考工具书、丛书等。 具体学科涉及:数学、物理与天文学、化学、生命科学、医学、工程学、计算机科学、环境科学、地球科学、经济学、法律。
ProQuest商业信息、学术研究、应用科技数据库涉及商业管理、社会与人文科学、科学与技术、金融与税务、医药学等广泛领域。 提供期刊、报纸、参考书、参考文献、书目、索引、地图集、绝版书籍、记录档案、博士论文和学者论文集等各种类型的信息服务,其中ProQuest Dissertations & Theses Global(PQDT Global)是目前世界上规模最大、使用最广泛的博硕士论文数据库。
PubMed 是一个免费的搜寻引擎,提供生物医学方面的论文搜寻以及摘要的数据库。 它的数据库来源为MEDLINE。 其核心主题为医学,但亦包括其他与医学相关的领域,像是护理学或者其他健康学科。 提供指向全文提供者(付费或免费)的链接。
EI在全球的学术界、工程界、信息界中享有盛誉,是科技界共同认可的重要检索工具。 涉及领域:机械工程、机电工程、船舶工程、制造技术、矿业、冶金、材料工程、金属材料、有色金属、陶瓷、塑料及聚合物工程等。
IEEE(Institute of Electrical & ElectronicsEngineers)是电气电子工程师协会IEEE和国际工程技术协会IET的全文库。 IEEE致力于电气、电子、计算机工程和与科学有关的领域的开发和研究,在太空、计算机、电信、生物医学、电力及消费性电子产品等领域已制定了1300多个行业标准,现已发展成为具有较大影响力的国际学术组织。
网络学术于2014年6月上线,是网络旗下的免费学术资源搜索平台,提供海量中英文文献学术资源,涵盖各类学术期刊、学位、会议论文,部分文献可直接下载。
sci-hub专门免费下载外文文献,但网站经常换域名,有时不稳定,新域名也有卡顿打不开现象,而且没有收录新文献,目前2022年文献基本下不到。
学术文献下载器(),把海量中外文献数据库资源整合一起,涵盖上面提到的文献数据库,文献资源庞大涉及全科,包括谷歌学术和sci-hub下载不了的文献。 适合学校资源不够的高校生或者是单位没有数据库资源的科研人员查阅下载文献资料。
谷歌学术微软学术和百度学术搜索功能比较
谷歌学术搜索Google Scholar是最老牌的学术搜索引擎,而微软学术搜索 Microsoft Academic Search是微软新推出的学术搜索。 但是在现今谷歌学术搜索大部分不能用的情况下,网络适时的推出了学术搜索网络学术。 这三个学术搜索引擎功能之间有何差距,选择哪一个比较好?科研动力为此时行了测试。 测试从3个方面来进行:搜索的全面性、搜索的易用性和搜索功能性。
学术搜索的全面性短关键词现在分别是关键词「AIDS」和相应的中文「艾滋病」进行泛搜索看看这三个学术搜索的结果的全面性。
谷歌学术搜索
谷歌学术搜索以「AIDS」为搜索得到226万个结果,而「艾滋病」为关键词进行搜索得到了23.5万个结果
微软学术搜索
微软学术搜索以「AIDS」的关键词进行搜索,首先得到是AIDS这个杂志的详细情况。 可以看到微软学术收录了AIDS这个杂志创刊于1925-2011年间的文献,其中这些年AIDS共发表了7855篇文章,被引次,自引5388次。
可是这不是我们希望得到的结果,我们希望得到的是以「AIDS」为关键词文章。 没关系,在结果的最上面有一行提示「This page shows one journal best matching your query, you can find other results here.」,选择之后就是以「AIDS」为关键词的文献。 可以看到微软学术搜索以「AIDS」为关键词搜出篇文献,比谷歌学术搜索的结果要少。
再以「艾滋病」为关键词进行搜索却发现一篇都没有命中,看来微软学术搜索只关注于英文文献,对于中文关键词的学术搜索结果不支持。
网络学术搜索
网络学术搜索以「AIDS」为搜索得到14.2万个结果,这是三个学术搜索中结果最少的。
再以「艾滋病」为关键词进行搜索得到16.2万个结果,比微软学术搜索强,但是比谷歌学术搜索差。
长尾关键词现在以Cell杂志发表的一篇文献的题目进行搜索看看,题目的名称是「The Rational Design of an AIDS Vaccine」。 另外再以中华医学杂志发表的一篇「云南省抗病毒治疗病毒学失败的艾滋病患儿的基因型耐药性分析」文献题目测试中文搜索情况。
谷歌学术搜索
谷歌学术搜索以「The Rational Design of an AIDS Vaccine」为关键词搜索直接命中文献,搜索结果中的第一条就是我们要找的文献。 而且全部搜索结果是篇文献,这全部的文献是把长尾关键词又分开了进行搜索得到的结果。
以「云南省抗病毒治疗病毒学失败的艾滋病患儿的基因型耐药性分析」为关键词进行搜索,也是直接命中文献,搜索结果中的第一条就是我们要找的文献。 全部搜索结果为75条。
微软学术搜索
微软学术搜索以「The Rational Design of an AIDS Vaccine」为关键词搜索也是直接命中文献,搜索结果中的第一条就是我们要找的文献。 全部的搜索结果是87篇文献,这比谷歌学术搜索要少很多。
以「云南省抗病毒治疗病毒学失败的艾滋病患儿的基因型耐药性分析」为关键词进行搜索,微软学术很悲催,一篇也没找到。
网络学术搜索
网络学术搜索以「The Rational Design of an AIDS Vaccine」为关键词搜索找到结果689篇,但是我想找的文献也不知道跑哪去了,搜出来的全部不是我想要的。
以「云南省抗病毒治疗病毒学失败的艾滋病患儿的基因型耐药性分析」为关键词进行搜索,网络学术这次表现不错,搜索结果中的第一条就是我们要找的文献。 全部搜索结果49条,要比谷歌学术少。
小结以搜索的全面性来讲,谷歌学术当之无愧的第一,而且精确性最好,无论英文中文都能很好的支持。 而微软学术对英文支持较好,但是对中文关键词不支持,也未收录中文文献。 网络学术对中文文献支持较好,但是英文文献比较悲催。
可以说谷歌学术搜索相当于微软学术的英文搜索加上网络学术的中文搜索。 网络学术的中文和微软的学术的英文相互结合,其搜索结果的全面性相当于谷歌学术搜索一个引擎的搜索结果。
搜索的易用性谷歌学术搜索
谷歌学术搜索搜索文献时基本上直接输入想搜索的关键词,一般都能找到自己想要的文献。 短关键词和长关键词支持都很不错,而且能较好的区分中文关键词和英文关键词,如果是英文关键词其结果就是英文,如果是中文关键词其结果就是中文文献。
但是有一点谷歌学术搜索对文献质量无法精确的定位,很多野鸡杂志的文献也包含其中。 部分野鸡出版商也是利用这一点,利用谷歌学术搜索的数据库伪造所谓的「影响因子」,混淆视听。 详细可以参阅伪造的影响因子判断方法及列表一文。
微软学术搜索
微软学术搜索对短关键词可能认为是杂志名称,因此利用微软学术搜索时关键词过短可能第一搜出来的是杂志名称,而不是我们想找的文献。
另外微软学术对结果的排列也不科学,如果关键词过短,微软第二给出的是作者名称,真是服了。 这可能对部分人有用,但是对大部分人来讲,这点可能造成操作的繁琐。
网络学术搜索
网络学术搜索一般是中文和英文文献结果混排,这点我认为不爽,明明想搜索英文文献的,网络学术却中文也一起给了。 给人的感觉像是在凑数。
搜索的功能性功能性除了对结果进行年代、相关性等筛选基本功能外,主要测试一下特色功能。
谷歌学术搜索
谷歌学术搜索其结果可以导出的文献管理软件,如EndNote导入Google学术搜索文献方法。 谷歌学术现在支持导入到BibTeX、EndNote、RefMan和RefWorks等文献管理软件。
另外还可保存到「将这篇文章保存到我的学术搜索图书馆」,以方便后面阅读。 微软学术的图书馆是个特色功能,每个人可以建立自己的图书馆,可以清楚的了解自己所发表的文献的详细引用情况,以及H指数和i10 指数(除了影响因子 还有哪些指标可以评价论文的价值)。 每个人还可以建立公开的页面,但是需要大学机构的邮箱验证方可,不然个人档案不会出现在学术搜索的结果中。 这点比较悲催,国内的大学很少提供大学邮箱,国内的大部分学者都是在使用Hotmail或者Gmail等免费邮箱。 而国外的学者多是使用自己大学的邮箱,使用自己大学的邮箱表明的是一种身份。 虽然大学邮箱并不见得比免费邮箱好使。 真不知道国内大学的领导信脑子里都在想啥。
谷歌学术搜索还支持对搜索结果的订阅,这样可以及时了解所关注的研究最新进展。 但是订阅只支持邮箱订阅,并不支持RSS订阅。
微软学术搜索
微软学术搜索的特色功能在微软学术搜索Microsoft Academic Search一文中进行过详细叙述。
概括来讲,微软学术最大的特色可以分析作者情况,这点有点像Web of Knowledge,另外还可以分析文献的详细引用情况。 现在支持BibTex、RIS和RefWorks导出方式。
微软学术也支持搜索结果的导入到文献管理软件,如EndNote导入微软学术搜索Microsoft Academic Search的文献方法。 但是其导出功能比较繁琐,需要打开要导出的文献。
微软学术搜索也支持对搜索结果的订阅,但是的RSS订阅。 这点和PubMed比较像。 如何选择订阅器可以参阅后Google Reader时代 该选择哪种RSS阅读器一文。 话说RSS订阅是好东西啊,可惜Google已不支持了。
网络学术搜索
网络学术搜索只支持对搜索结果的相关文献搜索,其它特色功能还没有。
总结谷歌学术搜索无论从哪方面来讲,都是三者中的首选。 但是现在访问Google Scholar非常困难,唉,不多说了。
微软学术搜索对英文文献的支持较好,数据库也较大,另外还有一些特色的功能。 如果是在科研设计阶段,可以考虑使用微软的学术搜索,分析一下文献的趋势和热度,研究的热点人物。 但是微软学术搜索对中文文献不支持,想查中文文献的就别用微软学术了。
网络学术对中文文献支持较好,但是网络学术的数据库太小了,而且搜索结果的准确性和搜索的易用性还需要进一步加强。
因此在Google Scholar不能使用的情况下,可以结合微软学术和网络学术两个搜索引擎进行学术搜索,了胜于无嘛。
欢迎大家拍砖和补充。
你真的会用谷歌学术吗?谷歌学术多条件检索攻略
对于研究生和研究人员来说,与大量文献打交道是必不可少的。 谷歌学术凭借其强大的功能成为了不可替代的外文检索工具。 很多人只限于使用简单的关键词搜索,然而,掌握谷歌学术的高级检索技巧,能极大地提高文献查找的效率和准确性。 首先,确保能够访问谷歌学术。 对于国内用户,可以通过谷歌学术镜像等方式来实现访问。 进入谷歌学术后,正式开始高级检索攻略。 第一步,利用多条件检索,精准定位目标。 在搜索框中输入关键词后,点击搜索按钮,系统将根据关键词返回相关文献。 第二步,设置多个条件,精细化筛选结果。 在高级检索页面,可以设定作者、期刊、年份等条件,有效缩小搜索范围,快速找到所需文献。 第三步,巧妙运用布尔运算符,实现进一步筛选。 通过AND、OR、NOT等运算符组合关键词,精确筛选出与研究主题紧密相关的文献,加速研究进程。 使用AND运算符,实现多个条件同时满足。 例如,搜索速凝剂 AND 硫酸铝,只返回包含这两个关键词的文献。 使用OR运算符,选取满足任一条件的文献。 例如,搜索磷石膏 OR 水泥,检索结果包含任一关键词的文献。 使用NOT运算符,排除特定关键词。 例如,搜索速凝剂 NOT 硫酸铝,排除与硫酸铝相关的文献。 还有其他检索技巧等待发现。 使用引号搜索精确短语或专有名词,如无碱速凝剂,仅返回包含该短语的结果。 使用星号作为通配符,搜索某个短语中某个词不确定的情况,如速凝剂*强度,返回以速凝剂开头,后面紧跟强度的文献。 设置文献发布时间范围,确保获取最新研究成果。 在高级搜索页面,调整时间范围,让检索结果紧跟学术前沿。 探索相关文献推荐,拓展研究领域。 在有价值的文献页面下方,通常会推荐相关文献,这些推荐文献可能引领你发现新的知识和研究方向。