首页 | 登陆 | 注册 | 申请 VIP | 发帖排名 | 会员列表 | 会员区 | 搜索 | 帮助

网友社区站务公告 → 对使用程序自动判断图片是否重复的想法与困 ...

【 浏览: 21033 | 回复: 151 】
作者
内容   本主题已关闭回复 添加收藏           
Jacky
超级管理员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [楼 主]

来自: 广东
鉴定: 保密
发帖: 134
注册: 2000-04-23

  向版主反映本帖
  大家可以看到由于刚开放的时候很多网友不断的上传图片,到现在每天重复的图片大于 30% - 40%,对于这类型的图片我们只能采取删除部分,因为如全部删除了贴图者又会叫:为什么删我的图....等等,这样一来造成:
1 网友不断的看重复的图.
2 回复越来越多:你这图早就贴过,看看别人的贴吧.
3 服务器空间一天一天的大量浪费

  因此我写了个程序核对图片是否重复,使用图片大小核对的方法,但.....,以下是我和 tomleg 管理员的对话请细看:
----------------------------------------
Jacky :
已经想到了。怎么在图片上传了,阻挡重复图片上传的方法
用图片的大小计算,
有可能造成不是相同的图片也会说重复
但已经准确的字节计算了 1KB = 1024 字节。
因此可能出现错误判断的机会很少.我正在测试.

半小时后:

Jacky :
用 3491 张图片测试,发现错误判断的有 44 张
80 张有一张判断错误
八十份之一判断错误,会不会太厉害?

tomleg :
如果你有一次判断失误,恐怕就会引发很多抱怨。现在来的人好像都是来讨债的,你今天为了净化"自拍论坛"封了一个人,就会招徕很多闲言碎语,何况把人家的“精品”判断错了?我们这些管理还不被人骂死?

Jacky:
这句话很经典啊~~~

tomleg:
没错啊!你现在就好像是一个欠所有人债的人!
---------------------------------------
(关于上述所提及的封了谁大家可到:
http://members.legfoot.net/showtopic.cgi?forum=1&id=1012369039

http://members.legfoot.net/showtopic.cgi?forum=1&id=1012370992
观看相关帖子)

  Tomleg 的话让我感触很深,真的很深,听完他这句话后,我突然觉得自己很累......很累,无法用言语去形容的累.从2001年11月4日我开始编写这论坛到现在,几乎没有一天休息时间是自己满足的.

  我不知道更不理解,大部分网友是否已经沉醉于网络免费太严重不能自拔了?我们一个免费的网站(从来没有收过一分钱),一个从来不跳出烦人的广告新窗口的网站(除非你在 bbs 收到悄悄话弹出),一帮尽心竭力免费义务为各位每天日以继夜、夜以继日工作着管理着的管理员和版主。还不能令你满意?我们每封一个会员都是不能再容忍的会员,都是超过一次、两次甚至更多更多违法规定的会员,难道这也应该继续由他任意妄为?

  想起办这站3年来的经历,除了得到一部分支持我们工作的网友们和一帮好版主们,真的不知道得到什么,说钱没钱说利益没利益 ,换回来的是我越来越累、身体越来越差。

  唉,不想多说了,苦水吐一天也写不完。在此想质询各位的意见是否应该采用程序自动判断图片是否重复的方案(但会有八十份之一判断错误的机会)。我们会很民主的,只要有 30% 网友觉得不应该采用,我们会继续使用原来的程序。

以下是于1月31日下午编辑写上的:

相信中午来过的网友都知道,论坛曾经关闭几个小时,就是核对图片重复问题,核对结果如下:

共上传图片:12584 - 现有图片:9294 = 删除图片:3290 张。

删除的图片中 50% 原因是因为严重重复而删除的。

在剩下的 9294 张图片中还有 936 张是重复的。

换句话说平均每天超过 100 张是和以前的图片重复!

相信这样下去很快就变每天 200 张重复图。

------------------------
由于昨晚写的程序会有八十份之一机会判断错误,因此今天重新编写,除了判断图片大小还增加了判断图片分辨率,效果还算满意。
同样用昨晚测试的 3491 张,用新程序去判断,结果只有一张判断错误.
当然这样的测试是不足够的,因此我把服务器上 936 重复图(因为需要核对两张图片判断,因此需要两张图都要下载,那么就是需要下载 936X2 = 1872 张!!)共 171 MB !下载回来自己测试究竟有多少是判断错误的,结果发现,判断错误的图片有:5 张,也就是说大大小于 二千份之一 机会判断错误。
当然会存在图片一样而大小和分辨率都不一的图片,那么这类型的只有人手删除。因此是否采用图片重复过滤,各位请三思!

在此需要提一提的是,重复图片部分是无心造成的,但!!部分是故意的,有些会员翻到前几天的图拷贝下来就重新贴上去,甚至连别人的名字也懒得改!实在可耻!

2002-01-31 01:50 [提示]: 会员等级如何分配?  IP: 保密     
yiyim
初级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [2]

来自: 北京
鉴定: 保密
发帖: 31
注册: 2002-01-26

  向版主反映本帖
 

建议在程序中加入文件格式的辨别,以2者结合来自动分辨图片是不是重复贴了的

2002-01-31 02:00 [公告]: 诚征各版版主数名,有意者请进。  IP: 保密     
hqcool
中级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [3]

来自: 湖北
鉴定: 保密
发帖: 54
注册: 2001-08-28

  向版主反映本帖
 

好是好。我赞成阿

可是,如果在图上加几笔,或是改变图像的大小

那么它的文件大小还是会改变阿。有可能图是一样的,但文件大小却不同了哦

2002-01-31 02:09 [广告]: VIP 专用新功能发布  IP: 保密     
ll852kk
中级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [4]

来自: 河北
鉴定: 保密
发帖: 54
注册: 2001-09-27

  向版主反映本帖
 

我支持判断重复贴图,不过是不是可以在判断后进行人工最后的决定,将一样大小的图一起吊出来,当然这要加大版主的工作量,而且也不是绝对保险,我自己就有过两张一样的图大小差了好几十K,不过还是判断一下好,起码节省大家时间

2002-01-31 02:54 [广告]: 为普及 VIP ,推出低廉的 临时VIP 项目  IP: 保密     
12034114
中级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [5]

来自: 其它
鉴定: 保密
发帖: 73
注册: 2002-01-13

  向版主反映本帖
 回复:Jacky

我会继续支持你的。我来这也有两年多了。
这是看到过的中国最的同类网站。真的,我会继续支持你的。

2002-01-31 04:30 [公告]: 诚征各版版主数名,有意者请进。  IP: 保密     
子逸
版主
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [6]

来自: 上海
鉴定: 保密
发帖: 841
注册: 2001-02-17

  向版主反映本帖
 回复:Jacky

支持Jccky的决定,利用程序先阻隔一些重复的图片,也请各位朋友可以理解站长的用心良苦,使天堂可以健康的发展下去 ~~~

2002-01-31 06:51 [广告]: 为普及 VIP ,推出低廉的 临时VIP 项目  IP: 保密     
Toad
中级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [7]

来自: 黑龙江
鉴定: 保密
发帖: 53
注册: 2001-12-25

  向版主反映本帖
 你好

以前我推荐过一个软件,不知你用过没有,我的图片大约有十万张,一直用它选图,不知适不适用。
d'peg!网址:www.somewareonthe.net
注册机我这里有

2002-01-31 07:22 [公告]: 诚征各版版主数名,有意者请进。  IP: 保密     
lukey
高级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [8]

来自: 广东
鉴定: 保密
发帖: 115
注册: 2001-10-28

  向版主反映本帖
 

我对网管的提议毫无保留地接受!解决金钱的问题,我看是否可以把图片录下来
作CD出售,好么?

2002-01-31 09:09 [广告]: VIP 高清晰美腿影片。高品质、高享受、强烈推荐  IP: 保密     
轼是
初级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [9]

来自: 辽宁
鉴定: 保密
发帖: 15
注册: 2002-01-25

  向版主反映本帖
 

看到站长们的话,让我想起以前焦点访谈的一期节目,就是类似的.
如果你们没有长久的经济来源,网站只有两条路,被人收购或关门.
所以上一些广告,或做一些收费栏目也是必然结果,尽管我没有钱,
但我还是会支持你们.
我同意关于图片测试大小的方法,大多数人都不会看遍所有论坛
里的贴子,还有以前的老贴子是否可清除一些.

2002-01-31 09:28 [推荐]: 点此进入本社区最多摄影大师、原创会员的 原创论坛  IP: 保密     
Sunshine
特级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [10]

来自: 北京
鉴定: 保密
发帖: 581
注册: 2001-12-25

  向版主反映本帖
 回复:Jacky

对不起,要说闲言碎语,昨天要数小弟最多了,昨日已在悄悄话中向老大道歉了,在这儿再次为了此事表示歉意,希望老大理解我好的出发点。
至于是否应用校对程序一事,小弟表示赞同。昨天还有位同好向我提起,为什么自己好端端的贴图,没有任何违规就被删除了,他自己现有50余帖,但曾被删的帖就有20多。还发来了刚被删去的图来看,图不错也算精品,只是有种似曾相识的感觉---重帖了!有很多同好是象他一样憋闷但又懒得向斑竹讨个说法的,可心里也不舒服。
所以,为了同好们的热情不被冻结,在此支持使用此程序,但希望如有重图,在同好上传同时告知失败原因,以免发帖后又删掉的尴尬!
在此向各位无私工作中的斑竹表示敬意。

2002-01-31 10:04 [提示]: 什么是金铜兑换?  IP: 保密     
金蛇郎君
高级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [11]

来自: 辽宁
鉴定: 保密
发帖: 103
注册: 2002-01-15

  向版主反映本帖
 回复:Jacky

太棒了!!!同意!!!如果重复贴的不算在每日五图之内就更棒 了!!!

2002-01-31 10:11 [广告]: VIP 专用新功能发布  IP: 保密     
zuoshou
初级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [12]

来自: 广东
鉴定: 保密
发帖: 41
注册: 2002-01-13

  向版主反映本帖
 这样可能会很慢 但绝对可以避免错误

读取图片文件的二进制代码,来进行比较,可以只读取特定的一段,
保存在数据库里,以备以后比较。

2002-01-31 10:16 [广告]: VIP 隆重推出顶级服务,高权限、无限制、大容量  IP: 保密     
笑傲江河湖海
特级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [13]

来自: 上海
鉴定: 保密
发帖: 503
注册: 2002-01-21

  向版主反映本帖
 回复:Jacky

确是如此,相信每一位每天看图的同好们都会发现,现在重复的图是越来越多了。因为大家的来源除了自拍以外无疑全是网站下载而来,那么多的人都在拼命找好图新图,可网站就那么几个,19000多个人都在一起找肯定是极易重复的,所以站长写程序真是迫在眉睫。但用下来好坏现在没人知道,只有试过之后才可以定夺。在试用期间不可避免的会出现很小的误差,这也是没有办法的,因为没有绝对完美的东西。我们为了大家有着更充足的空间来交流和赏图,应该支持站长的决定。
关于某位同好被封号,为了维护天堂的利益和秩序,也必须这样做的。因为没有一个蓝蓝的天空,那还能有鸟吗?
我们都知道,免费网站是出力不讨好的,但我们的站长为了把这样好的一个网站日以继夜的保留下来供我们广大同好来共同交流,难道我们就不能体谅一下日日夜夜坚守在第一线的管理员和版主们吗? (个人意见!)

2002-01-31 10:18 [广告]: VIP 专用新功能发布  IP: 保密     
plx7274
初级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [14]

来自: 山东
鉴定: 保密
发帖: 26
注册: 2001-12-30

  向版主反映本帖
 完全支持!

说真的,网上像天堂这样大型而精美的免费恋物网站已屈指可数了,它的存在就是我们这些爱好者的最大福音,所以我坚决支持管理员所采取的措施,毕竟也是为了大家能更好的欣赏天堂的美图嘛。

2002-01-31 15:00 [提示]: 会员等级如何分配?  IP: 保密     
丁笑天
初级会员
消息  查看  收藏  搜索  搜图  编辑  引用  回复  | 只看该作者  [15]

来自: 江苏
鉴定: 保密
发帖: 46
注册: 2000-08-05

  向版主反映本帖
 同意

最讨厌那些贴别人图的人
不过用了筛选程序,速度又要慢一些了
能不能把所有图做个缩略,以备查(好象不太现实
能不能在上传时,让上传的人大致给自己的图分一个类(类别由网站规定,网友只能选择)。再在类别中查重复,可能要快一点(一点愚见,甚是惶恐)

2002-01-31 15:27 [广告]: 加入 VIP ,尽赏原创精品  IP: 保密     
    
本主题共有 11  1 2 3 4 5 6 7 8 9 10 11   ]


所用时间: 北京时间. 现在时间: 2024-05-18 21:53

本站所发文字和图片信息仅代表发帖者个人观点,与本站立场无关.
本站拒绝一切与中华人民共和国法律相抵触的言论,违者将其IP等相关信息报送公安机关处理!

< 联系我们 - 柔性天堂 - 社区须知 >