来自: 广东 鉴定: 保密 发帖: 673 注册: 2000-04-23 |
向版主反映本帖
|
在 2002年1月底,发表 《对使用程序自动判断图片是否重复的想法与困扰!》后,自2002年2月起,本站开始有图片重复核对程序,当时上传贴图只有12000张,由于程序使用检查图片尺寸、字节方式核对图片是否重复,如果两张虽然图片尺寸字节一致的图片,但图片内容不一,一样会误认为重复,就在这少量图片内,错误判断重复机率约 1/2000 ,两年来一直沿用该程序作为图片重复核对。至今图片核对数据库已经高达 383504 条,也就是说错误判断机会更高,可能是 1/1000 ,甚至 1/500。因此重新整理数据库,编写新图片重复核对程序势在必行。
在 2004年1月中 《关于重复图片判断程序的困扰,会员请进……》 文中提出整理数据库的想法,得到会员们的支持和赞同。期间我们已经编写了全新算法的图片重复核对程序,新程序错误判断机率绝对小于 千万分之一 (毫不夸张,甚至能达到亿分之一),使用新程序后,如果程序提示正在上传的图片是重复、违规,那么就一定是判断正确的(毕竟现在只有几十万贴图,距离千万分之一甚至亿分之一的错误率距离很大)。
因此整理旧数据库以配合新图片重复核对程序运行,于本日(2004年2月20日),重新构建新的数据库,原有已经删除的图片核对数据将全部清理,只留下现存图片的数据作为新数据库的开始,从原来旧数据库的 383504 条构建为新数据库 261019 条。在即日起不会再出现,因为图片判断错误而导致不能上传并不重复的图片,也从即日起如果您在上传图片中看到“您正在上传图片已经曾经被其他网友上传,为了避免不必要的重复,请选择其他更精美的图片上传!” 或 “您正在上传图片已经曾经被其他网友上传,并且可能因为违反规定或重复等原因被删除,请选择其他更精美的图片上传!” 等提示信息,请不要试图使用其他方法把图片上传,因为该图片确实重复或违反规定了,继续上传,也只会删除而已。
在新数据库构建后,以前重复、违规的图片,由于旧有数据库的清理,现在会较容易上传。因此,最近删除相应的帖子会比较多,对违规帖的删除不仅是论坛一贯的规定,也是新数据库学习阶段所必需且必要的,请大家理解与支持,在上传图片之前请仔细再仔细,审查再审查,尽量做到0违规帖,这不仅是给予论坛管理上的巨大帮助,更是养成良好贴图习惯的一次很好的锻炼机会。由于新数据库的学习原因,短期内重复图片会有一定量的增加,为了论坛将来管理的效率,请大家予以一定的谅解,但管理团队仍会对重复性质的图片持一定的态度。 2004年2月21日零时起,新判断程序将正式开始启用,对在图片上传中出现的新问题欢迎大家予以反映,以便对可能存在的问题及时进行修改。 |
|